뉴스 크롤링 기능 설정 가이드

부동산 및 청약 관련 뉴스 자동 수집

청약플래닛 백엔드 관련 문서입니다.

개요

부동산 및 청약 관련 뉴스를 자동으로 수집하여 커뮤니티에 포스트로 생성하는 기능입니다.

환경 변수 설정

다음 환경 변수를 설정해야 합니다:

# 네이버 뉴스 API
NAVER_CLIENT_ID=your_naver_client_id
NAVER_CLIENT_SECRET=your_naver_client_secret

네이버 API 키 발급

  1. 네이버 개발자 센터 접속
  2. 로그인 후 "Application 등록" 클릭
  3. 애플리케이션 정보 입력:
    • 애플리케이션 이름: CheonYakPlanet News
    • 사용 API: 검색 API 선택
    • 서비스 환경: 웹 서비스 URL 등록

기능 상세

자동 스케줄링

크롤링 키워드

다음 키워드로 뉴스를 검색합니다:

포스트 분류

중복 방지

수동 실행

관리자는 다음 API를 통해 수동으로 뉴스 크롤링을 실행할 수 있습니다:

POST /api/news/crawl
Authorization: Bearer {access_token}

시스템 사용자

뉴스 포스트는 `jjsus0307@gmail.com` 계정으로 생성됩니다. 해당 계정이 데이터베이스에 존재해야 합니다.

설정 옵션

`application.properties`에서 다음 설정을 변경할 수 있습니다:

# 뉴스 크롤링 설정
news.api.max-results=10                    # 키워드당 최대 뉴스 수
news.api.delay-between-requests=1000       # API 요청 간 지연시간(ms)
news.scheduling.enabled=true               # 자동 스케줄링 활성화
news.scheduling.cron=0 0 9 * * ?          # 크론 표현식
news.scheduling.max-daily-posts=20        # 일일 최대 포스트 수

로그 확인

다음 로그를 통해 실행 상황을 확인할 수 있습니다:

INFO  - 부동산 뉴스 크롤링 시작
INFO  - 뉴스 포스트 생성: [뉴스 제목]
INFO  - 부동산 뉴스 크롤링 완료
ERROR - 뉴스 크롤링 중 오류 발생 - 키워드: {keyword}

보안 고려사항