[Python] 네이버 영화 한줄평 크롤링 코드

Posted by 적분 ∫2tdt=t²+c
2017.03.17 01:03 프로그래밍

스팀 게임평이 양이 적어서 감성사전을 구축하기 어렵다고 판단하여 네이버 영화 평점을 수집하는 일을 수행했었는데요, 이 역시 수집만 하고 다음 단계로 넘어가지 않았기에 방치해두기 아까운 코드, 공유해드립니다.


앞의 글과 마찬가지로 Python3로 작성되었으며, 실행을 위해서 BeautifulSoup 라이브러리가 필요합니다.



실행하면 comments 폴더 안에 txt파일로 영화평들이 다운로드됩니다. comments 폴더를 미리 만들어두셔야 에러가 안 날거에요.

Tags
이 댓글을 비밀 댓글로
    • setinal
    • 2017.07.25 23:57 신고
    잘 이용하였습니다. 감사합니다. comments 폴더에 저장될 때 1 2 3 이렇게 저장되서 따로 해당 코드의 영화제목을 알아와서 전 제목별로 저장하니깐 한결 보기 편하더라구요 ㅎㅎ
    • 2018.05.10 23:05
    비밀댓글입니다
    • 먼저 수집할 영화들의 코드 번호를 확인하셔야합니다. 위의 파이썬 소스는 그냥 10000에서 200000까지로 잡았는데, 실제 해당 코드 번호는 존재하지 않는 번호입니다.

      네이버 영화 페이지에서 영화를 검색하여 들어가시면 https://movie.naver.com/movie/bi/mi/point.nhn?code=169347#tab 처럼 code 번호가 나옵니다. 원하는 코드 번호를 이용해 getComments(code)를 호출하시면 해당 영화의 평점이 수집됩니다.