크라우드웍스, 고품질 데이터셋 유통 시작하며 AI 시장에서의 성장 기대
크라우드웍스는 최근 법적 리스크가 없는 고품질 데이터셋 유통 및 판매 사업을 본격적으로 시작했다고 발표했다. 인공지능(AI) 시장에서 데이터의 라이선스와 투명성이 중요한 이슈로 떠오르고 있으며, 유럽연합(EU)은 AI 기업들에게 학습 데이터 정보를 공개할 것을 의무화하고 있다. 미국에서도 저작권 침해 소송이 증가하고 있고, 지난 10월에는 다우존스와 뉴욕포스트가 AI 검색 스타트업 퍼플렉시티를 상대로 저작권 소송을 제기한 바 있다. 이처럼 AI 학습용 데이터셋의 중요성이 커지는 상황에서 크라우드웍스는 각종 산업 특화 데이터셋을 유통하게 되었다.
크라우드웍스가 제공하는 데이터셋은 모두 라이선스를 확보한 것이며, 저작권 침해 및 개인정보 보호와 같은 법적 리스크가 없다. 이 데이터셋은 검증된 전문가 그룹이 구축해 전문성과 신뢰성을 갖추고 있다. 웍스원 데이터셋은 숫자, 문장, 글 등 기업이 자주 원하는 답변 형식을 제공하며, AI가 기업의 선호에 맞춘 표현으로 답변할 수 있도록 설계되었다. 이 데이터셋은 15년 이상의 기획경험을 가진 전문가들이 직접 개발하였고, 이를 학습한 소형언어모델 웍스원은 다양한 답변 요구를 충족할 수 있는 성능을 보여주었다.
광고 분석 데이터셋은 한국 내 광고 1만여 건을 분석하여 다루는 데이터로, 광고정보, 타깃, 목표 등의 메타데이터가 포함되어 있어 창의적인 AI 서비스 개발에 활용될 수 있다. 또한, 기업정보 데이터셋은 전 세계 240개국의 3억 개 이상의 최신 기업 정보를 포함하고 있으며, 이는 다양한 산업 분야에서 필요한 정보를 제공하는 데 유용하다.
크라우드웍스는 이 외에도 건강검진 결과와 뉴스 기사 등의 데이터셋도 판매하고 있으며, 전문가의 Q&A 데이터셋도 제공하고 있다. 이 모든 데이터셋은 크라우드웍스의 웹사이트를 통해 구매 문의가 가능하다. 이 회사는 AI 기술을 기반으로 엄격한 검수 과정을 통해 고품질 데이터를 제공하고 있으며, 2억 6천만 개 이상의 AI 데이터를 구축한 경험이 있다.
김우승 대표는 "AI 프로젝트 성공을 위해서는 데이터 양보다 품질에 집중해야 한다"고 강조하며, 신뢰할 수 있는 데이터셋을 통해 기업의 AI 프로젝트 성공을 지원하겠다고 말했다. 현재 글로벌 AI 학습 데이터셋 시장은 약 26억 3000만 달러 규모로 추정되며, 연평균 성장률 21.5%를 기록할 것으로 보인다. 2028년까지 시장 규모는 약 57억 3000만 달러에 이를 것으로 예상된다. 이는 AI 데이터의 수요가 증가하고 있다는 직접적인 증거로, 크라우드웍스의 데이터 유통이 시장에서 중요한 역할을 할 것으로 기대된다.
│
이 포스트는 피시아(PHYSIA) 사에서 운영하는 게임투비즈(GameToBiz) R&D 블로그에서 작성되었으며, 공공의 이익에 기여하는 목적을 제외한 다른 용도의 무단 배포 및 수정을 금합니다. 참조 - 피시아(PHYSIA), 게임투비즈(GameToBiz), 게임메이커.KR, 게임S/W에이전시, 저널CTL코리아