프로젝트 소개
왜 이 프로젝트가 필요한가요?
"고용노동부 실업급여 신청 방법 알려줘"라고 ChatGPT에 물어본 적 있으신가요? AI가 정확한 답변을 하려면 해당 부처의 웹사이트에서 최신 정보를 읽어올 수 있어야 합니다. 하지만 많은 정부 웹사이트가 AI의 접근을 차단하고 있어, AI는 오래된 정보나 부정확한 답변을 할 수밖에 없습니다.
이 프로젝트는 간단한 질문에서 출발합니다: "대한민국 공공 웹사이트는 AI에게 열려 있는가?"
구체적으로 무엇을 확인하나요?
모든 웹사이트에는 robots.txt라는 파일이 있습니다. 이 파일은 "이 웹사이트에 어떤 프로그램이 접근해도 되는지"를 정하는 규칙입니다. 예를 들어:
- 좋은 예: "보도자료와 정책 페이지는 누구나 읽어가세요" → AI가 최신 정책 정보를 정확히 전달할 수 있음
- 나쁜 예: "모든 접근을 차단합니다" → AI가 해당 기관의 정보를 전혀 읽을 수 없음
우리는 각 공공 웹사이트의 robots.txt를 분석해서, 보도자료·정책소개·공지사항 같은 국민에게 전달되어야 할 핵심 정보가 AI에게 차단되고 있는지 확인합니다.
왜 이게 중요한가요?
2026년 현재, AI는 수천만 명의 한국인이 매일 사용하는 도구입니다. "우리 동네 쓰레기 분리수거 방법"을 물어보든, "중소기업 지원 정책"을 검색하든, AI가 정확한 정보를 전달하려면 원본 출처인 공공 웹사이트의 문이 열려 있어야 합니다.
문이 닫혀 있으면 AI는 추측하거나 오래된 정보를 전달합니다. 이는 시민에게 피해를 줄 수 있고, 정부 정책에 대한 오해를 만들 수 있습니다.
어떤 기관을 평가하나요?
중앙정부부터 동네 주민센터까지, 공공 웹사이트를 운영하는 모든 기관을 평가합니다.
- 중앙행정기관 — 재정경제부, 교육부, 보건복지부 등 19개 부 + 6개 처 + 15개 청
- 지방자치단체 — 서울시, 경기도 등 17개 광역 + 227개 시·군·구
- 공공기관 — 한국전력, 국민건강보험공단 등 ALIO 등록 344개 기관
평가 항목
총 100점 만점으로 6개 카테고리를 평가합니다.
| 카테고리 | 배점 | 주요 평가 항목 |
|---|---|---|
| robots.txt | 25점 | LLM 크롤러 차단 여부, 전면 차단 여부, 핵심 콘텐츠 경로 비차단 (핵심) |
| 콘텐츠 접근성 | 25점 | 보도자료·정책소개·공지사항에 LLM이 차단 없이 접근 가능한지, SSR 렌더링 (핵심) |
| 구조화된 데이터 | 20점 | title/meta description 적절성, Open Graph, schema.org, 언어 속성 |
| 기술적 접근성 | 15점 | HTTPS, 응답 속도, HTTP 상태, 모바일 대응 |
| llms.txt | 10점 | 파일 존재 여부, 문법 유효성, 내용 충실도 |
| sitemap.xml | 5점 | 존재 여부, 유효성 및 콘텐츠 URL 포함 |
등급 체계
제약사항
각 기관은 상급기관의 보안 지침 또는 자체 정보보안 정책에 따라 웹사이트 설정이 제한될 수 있습니다. 예를 들어, 국가정보원의 보안 가이드라인, 상위 부처의 일괄 보안 정책, 기관 자체 정보보호 규정 등으로 인해 robots.txt나 크롤링 정책을 기관 단독으로 변경하기 어려운 경우가 있습니다.
본 평가는 이러한 제약을 비난하려는 것이 아니라, 현황을 파악하고 개선 논의의 출발점을 제공하기 위한 것입니다.
분석 방법
분석은 아래 과정을 거쳐 수행됩니다:
- 대상 기관 웹사이트의 robots.txt, llms.txt, sitemap.xml 수집
- 주요 콘텐츠 경로 파악 (보도자료, 정책자료, 공지사항 등)
- 메타데이터 및 구조화된 데이터 점검
- 기술적 접근성 테스트 (HTTPS, 응답 속도, 렌더링 방식 등)
- 스코어링 기준에 따른 점수 산정 및 등급 부여
- 문제사항 코드 생성 및 개선 권고문 작성
기여 방법
이 프로젝트는 오픈소스로 운영됩니다. 다음과 같은 방법으로 기여할 수 있습니다:
- 오류 제보: 분석 결과에 오류가 있다면 GitHub Issues를 통해 알려주세요.
- 데이터 추가: 아직 분석되지 않은 기관의 데이터를 추가해 주세요.
- 기능 개선: 웹사이트 기능이나 스코어링 모델 개선 제안을 환영합니다.
- 홍보: 이 프로젝트를 알려주시면 더 많은 기관이 개선에 참여할 수 있습니다.
데이터 접근
분석 결과 데이터는 누구나 자유롭게 활용할 수 있습니다:
- 결과 JSON — 전체 분석 데이터
- 점수 CSV — 기관별 점수 요약
- 기관 목록 JSON — 전체 분석 대상 기관 목록
Disclaimer
본 웹사이트는 개인 프로젝트로 운영되며, 정부 공식 입장과 무관합니다. 분석 결과는 자동화된 도구와 수작업 검토를 병행하여 생성되나, 정확성을 완전히 보장하지 않습니다. 오류를 발견하신 경우 GitHub Issues를 통해 알려주시면 확인 후 수정하겠습니다.