SmartCrawler
vv1.5.0 · 2026년 3월 28일
다운로드 (12.8 MB)
1,800회 다운로드
자연어로 수집 대상을 정의하면 AI가 자동으로 데이터를 추출하는 지능형 크롤러.
AIPythonPlaywright

개요

SmartCrawler는 자연어로 수집 대상을 정의하면 AI가 자동으로 웹 데이터를 추출하는 지능형 크롤러입니다. 복잡한 사이트 구조도 AI가 자동으로 분석하고 탐색합니다.

주요 기능

  • 자연어 크롤링 — "쿠팡에서 노트북 가격 수집해줘" 같은 자연어 명령으로 크롤링합니다.
  • AI 데이터 추출 — GPT-4가 페이지 구조를 분석하고 필요한 데이터를 자동 추출합니다.
  • JavaScript 렌더링 — Playwright 기반으로 SPA, 동적 페이지도 완벽 지원합니다.
  • 스케줄링 — cron 기반 자동 반복 크롤링을 지원합니다.
  • 내보내기 — JSON, CSV, Excel 등 다양한 형식으로 데이터를 내보냅니다.

사용 예시

from smartcrawler import Crawler

crawler = Crawler(api_key="your-key")
result = crawler.scrape(
    url="https://example.com/products",
    instruction="모든 상품의 이름, 가격, 평점을 수집해줘"
)
result.to_csv("products.csv")

시스템 요구사항

  • Python 3.9 이상
  • Chrome 또는 Chromium 설치
  • OpenAI API 키