[더팩트ㅣ이준영 기자] 정부는 보건복지부와 관계 공공기관이 발간하는 규정집 등 공공저작물이 인공지능(AI) 학습데이터로 활용될 수 있도록 공공저작물 자유이용 허락표시 기준(공공누리) 유형전환을 추진한다고 11일 밝혔다.
공공누리 유형을 기존에 변경금지, 상업적 이용금지, 출처명시였던 것을 변경가능, 상업적 이용가능, 출처명시로 바꾼다.
대규모 언어 모델(LLM) 등 AI 학습을 위한 고품질 공공데이터 수요가 급증하는 가운데, 정부가 간행한 규정집 등 공식 문서는 AI 학습에 가치가 높은 데이터로 평가된다. 특히 의료 분야 AI 개발기업들은 복지부·건강보험심사평가원 등의 규정을 학습하고 지식화하는 데에 노력을 기울이고 있다. LLM은 대규모 텍스트 데이터를 학습해 자연어 이해와 생성 작업을 하는 AI 모델이다.
보건복지부는 1호 유형 변경 사례로 '보건의료데이터 활용 가이드라인'을 재공고하며, 이를 시작으로 복지부와 관계 공공기관이 발간하는 대다수 공공저작물이 AI 학습데이터로 원활히 활용될 수 있도록 조속히 전환해 나갈 예정이다.
박정환 보건의료데이터진흥과장은 "이번 공공누리 유형 전환은 보건복지분야 AI 개발을 위한 밑거름이 될 것으로 기대한다"며 "정부는 앞으로도 AI 기술 발전을 위한 제도 개선을 적극적으로 추진하겠다"고 밝혔다.
lovehope@tf.co.kr