python/Pandas
-
[+Code] pd.melt 정복하기python/Pandas 2020. 10. 24. 04:03
데이터프레임을 생성합니다. df = pd.DataFrame(data = {"Month":["1월","2월","3월","4월","5월", "6월","7월","8월","9월","10월"], "부산":np.random.randint(10, size=(1,10)).tolist()[0], "서울":np.random.randint(20,size=(1,10)).tolist()[0], "광주":np.random.randint(30,size=(1,10)).tolist()[0]}) df 월별 교통사고 건수에 대한 데이터셋을 임의로 만들었습니다. 만약 컬럼이 대한민국 시별로 구성되어 있고, 지역별 교통사고 건수의 평균을 알아보고 싶으면 어떻게 해야 할까요? 가능은 하겠지만 귀찮습니다. 보통 자주 사용하는 groupby함수도..
-
[+Code] concat, merge 정복하기python/Pandas 2020. 10. 24. 03:37
데이터 분석을 하다보면 데이터를 합쳐야 할 경우가 자주 생기게 됩니다. 유용하게 사용할 수 있는 대표적인 데이터프레임 병합 방법인 concat과 merge를 알아보겠습니다. pd.concat concat이 유용한 경우는, 같은 데이터셋의 형식을 가지고 있지만 내용이 경우입니다. 예를 들어 A 도시에서 자전거 이용 데이터를 월별로 제공한다면, 우선 월별로 다운받은 후 concat하는 것 등입니다. df = pd.DataFrame(data={"Date":["1월","1월","1월","1월","1월","1월","1월"],"점포":["A","B","C","D","F","G","H"], "방문객 수":[234,256,622,636,910,30,60]}) df1 = pd.DataFrame(data={"Date":[..
-
DataFrame Value에 리스트가 들어가 있을 때 DataFrame을 저장하면 문자열로 바뀌는 문제python/Pandas 2020. 9. 4. 00:03
Pandas의 value에 리스트를 담을 수 있다. 아래와 같이 리스트가 들어있는 데이터프레임을 생성한 후, value를 인덱싱 해보면 class가 list로 출력된다. 하지만 이 데이터프레임을 csv, 혹은 excel로 저장한 후에 다시 read를 하게되면 아래와 같이 리스트가 문자열로 바뀌어있는 것을 확인할 수 있다. nltk를 사용하여 게시글들을 형태소단위로 나눈 후, apriori알고리즘을 사용하여 문자들 간의 빈발집합을 확인하려던 중 이러한 문제가 발생하였다. a = pd.DataFrame(data={'test':[[1,2],[2,3],[3,4]]}) print(a.test[0], type(a.test[0])) >>> [1, 2] a.to_csv("./a.csv") b = pd.read_csv(..