본문으로 건너뛰기

Django 리포지토리 크롤링하기

Django 리포지토리 크롤링하기

Django(장고)는 파이썬으로 웹 서버를 개발할 때 사용하는 인기 있는 웹 프레임워크입니다.

이번 프로젝트는 소스 코드 저장소인 GitHub 내부의 Django 프로젝트 리포지토리(Repository, 코드 저장소)를 크롤링하여 원하는 데이터를 수집합니다.


참고사항

깃허브의 특정 리포지토리 정보(예: Django)를 크롤링하는 것은 GitHub의 API를 사용하는 것이 가장 적합합니다.

하지만 여기서는 웹 크롤링 학습 목적을 위해 BeautifulSoup을 사용하는 방법을 소개하겠습니다.

주의할 점으로 GitHub의 웹 페이지 구조는 언제든지 변경될 수 있으며, 이는 예제 코드의 수정이 필요할 수 있습니다.

실제 프로젝트에서는 가능한 GitHub의 공식 API를 사용하는 것이 좋습니다.


실습

화면 오른쪽 코드 실행 버튼을 누르고, 크롤링 결과를 확인하거나 코드를 수정해 보세요!