데이터분석3 [데이터 분석] Kaggle 데이터셋을 활용한 할로윈 데이 캔디 분석 1. 개요 매년 10월 31일 할로윈 데이에는 캔디를 주고 받는 문화가 있다. 어떤 특징을 가진 캔디가 가장 인기 있는지 분석해 보자. 2. 데이터 출처 캐글(Kaggle): The Ultimate Halloween Candy Power Ranking https://www.kaggle.com/datasets/fivethirtyeight/the-ultimate-halloween-candy-power-ranking The Ultimate Halloween Candy Power Ranking What’s the best Halloween candy? www.kaggle.com 3. 데이터 설명 이 데이터 세트는 Wait Hickey에서 참가자들이 사탕 두 개를 제시받고 받고 싶은 사탕을 클릭하도록 요청하는 웹.. 데이터분석 2024. 1. 11. [데이터 분석]크롤링을 활용한 쇼핑몰 키워드 기반 귤 상품 분석-2 이번 포스팅에서는 이전 포스팅에서 다루었던 크롤링을 통해 생성된 데이터를 활용해 연관규칙을 분석하고 해석해 볼 것이다. 이전 포스팅 https://anhong1.tistory.com/7 [데이터 분석]크롤링을 활용한 쇼핑몰 키워드 기반 귤 상품 분석-1 1. 주제선정 겨울에는 귤! 주변에 귤을 좋아하는 사람들이 정말 많은데 구매에 도움이 되는 분석을 해 분석된 자료를 직접 활용해보기로 하였다. 2. 개요 우선 네이버, 우체국 마켓, 홈플러스 등 anhong1.tistory.com 4. 데이터를 활용한 연관규칙 분석 이전 포스팅에서 네이버, 홈플러스, 우체국 등의 온라인 쇼핑몰에서 크롤링을 통해 3개의 데이터 파일을 추출했다. 이 파일들을 병합하고 apriori 함수를 사용 연관규칙을 분석해 보자. 우선 .. 데이터분석 2024. 1. 2. [데이터 분석]크롤링을 활용한 쇼핑몰 키워드 기반 귤 상품 분석-1 1. 주제선정 겨울에는 귤! 주변에 귤을 좋아하는 사람들이 정말 많은데 구매에 도움이 되는 분석을 해 분석된 자료를 직접 활용해보기로 하였다. 2. 개요 우선 네이버, 우체국 마켓, 홈플러스 등의 사이트에서 귤이라는 키워드를 검색하고 리뷰가 많은 순으로 정렬하여 웹 크롤링을 통해 데이터를 csv 파일로 저장한 뒤 apriori 연관규칙 분석 알고리즘을 활용하여 키워드를 분석해보도록 하자. 3. 웹 크롤링 첫 번째로 네이버 쇼핑에서 귤을 검색하면 나오는 이 페이지를 기준으로 셀레니움을 활용하여 크롤링을 진행해보기로 하였다. 위와 같은 코드로 코랩에서 셀레니엄 사용 설정을 하고 URL에 해당 주소를 넣어 URL을 설정해준다. 그 다음 다음 화면처럼 리뷰가 많은 순으로 상품을 정렬하여 크롤링을 진행하기 위해 .. 데이터분석 2024. 1. 2. 이전 1 다음