python
-
[KAKAO API]주소 입력 후 X,Y 좌표 반환python/api 2020. 12. 30. 17:55
'사직동'으로 입력하게 되면 좌표는 사직동의 중심좌표 ( 보통 동사무소 ) 형태로 좌표를 반환한다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 import requests KAKAO_API_KEY='your api key' Start_Address = "부산광역시 동래구 사직동" End_Address = "부산광역시 부산진구 부전동" Start_url = f'''https://dapi.kakao.com/v2/local/search/address.json?query={Start_Address}''' End_url = f'''https://dapi.kakao.com/v2/local/search/address.json?query={End_Address}''' head..
-
[+Code] pd.melt 정복하기python/Pandas 2020. 10. 24. 04:03
데이터프레임을 생성합니다. df = pd.DataFrame(data = {"Month":["1월","2월","3월","4월","5월", "6월","7월","8월","9월","10월"], "부산":np.random.randint(10, size=(1,10)).tolist()[0], "서울":np.random.randint(20,size=(1,10)).tolist()[0], "광주":np.random.randint(30,size=(1,10)).tolist()[0]}) df 월별 교통사고 건수에 대한 데이터셋을 임의로 만들었습니다. 만약 컬럼이 대한민국 시별로 구성되어 있고, 지역별 교통사고 건수의 평균을 알아보고 싶으면 어떻게 해야 할까요? 가능은 하겠지만 귀찮습니다. 보통 자주 사용하는 groupby함수도..
-
[+Code] concat, merge 정복하기python/Pandas 2020. 10. 24. 03:37
데이터 분석을 하다보면 데이터를 합쳐야 할 경우가 자주 생기게 됩니다. 유용하게 사용할 수 있는 대표적인 데이터프레임 병합 방법인 concat과 merge를 알아보겠습니다. pd.concat concat이 유용한 경우는, 같은 데이터셋의 형식을 가지고 있지만 내용이 경우입니다. 예를 들어 A 도시에서 자전거 이용 데이터를 월별로 제공한다면, 우선 월별로 다운받은 후 concat하는 것 등입니다. df = pd.DataFrame(data={"Date":["1월","1월","1월","1월","1월","1월","1월"],"점포":["A","B","C","D","F","G","H"], "방문객 수":[234,256,622,636,910,30,60]}) df1 = pd.DataFrame(data={"Date":[..
-
[+Code]KFold, Stratified, Repeated, Group의 차이점python/scikit-learn 2020. 10. 23. 12:14
참조 : towardsdatascience.com/how-to-train-test-split-kfold-vs-stratifiedkfold-281767b93869 How to train_test_split : KFold vs StratifiedKFold Explained with examples towardsdatascience.com 여러 모델들을 학습시키다보면 필연적으로 train set과 test set을 나눠야 하는 일이 발생합니다. 한 번만 나누는 경우는 sklearn에서 제공하는 train_test_split함수를 사용하기도 하지만 많은 경우 cross validation이 가능한 Kfold를 사용합니다. KFold의 방법인 sklearn의 KFold, StratifiedKFold, Repeat..
-
DataFrame Value에 리스트가 들어가 있을 때 DataFrame을 저장하면 문자열로 바뀌는 문제python/Pandas 2020. 9. 4. 00:03
Pandas의 value에 리스트를 담을 수 있다. 아래와 같이 리스트가 들어있는 데이터프레임을 생성한 후, value를 인덱싱 해보면 class가 list로 출력된다. 하지만 이 데이터프레임을 csv, 혹은 excel로 저장한 후에 다시 read를 하게되면 아래와 같이 리스트가 문자열로 바뀌어있는 것을 확인할 수 있다. nltk를 사용하여 게시글들을 형태소단위로 나눈 후, apriori알고리즘을 사용하여 문자들 간의 빈발집합을 확인하려던 중 이러한 문제가 발생하였다. a = pd.DataFrame(data={'test':[[1,2],[2,3],[3,4]]}) print(a.test[0], type(a.test[0])) >>> [1, 2] a.to_csv("./a.csv") b = pd.read_csv(..