[ADK2021] 데이터톤 정확도 1위 '한우는 음머음머'팀 "최대한 많은 데이터 활용한 것이 우승 비결"
[ADK2021] 데이터톤 정확도 1위 '한우는 음머음머'팀 "최대한 많은 데이터 활용한 것이 우승 비결"
  • 장희원 기자
  • 승인 2021.09.01 11:39
  • 댓글 0
이 기사를 공유합니다

[편집자 주] 지난 8월, 한국축산테크협회는 세계 최초 가축 이미지를 활용한 인공지능 데이터톤 ‘Animal Datathon Korea 2021(이하 ADK2021)’을 개최해 축산 인공지능(AI) 기술 성장의 장을 마련했다. 전 세계적으로 찾기 어려운 가축 이미지 데이터를 활용해 AI 모델을 개발하는 무대에 다양한 AI 분야 실력자들이 모였다.

치열한 경합 끝에 다양한 배경을 가진 5개 팀이 ADK2021 시상대에 올랐다. 램인터내셔널이 5개 입상팀 릴레이 인터뷰를 통해 이들의 세계 최초 가축 데이터톤 참가 소감과 AI 모델 개발 노하우를 들어봤다.

[램인터내셔널=장희원 기자] ADK2021 참가자에게는 한우 및 젖소에 대한 키포인트(Keypoint) 탐지 AI 모델 개발 과제가 주어졌다. 제출한 모델은 키포인트 좌표 정확도와 추론시간, 두 가지 기준으로 심사해 순위를 매겼다.

정확도 부문 1위에는 박준형(팀장·현대모비스 데이터사이언스팀 근무), 김서하(팀원·연세대 졸업), 서윤지(팀원·연세대 4학년) 3인으로 구성된 '한우는 음머음머'팀이 차지했다. 박준형 씨가 근무 중인 데이터사이언스팀에 김서하, 성윤지 씨가 인턴으로 근무한 것이 인연이 돼 함께 팀을 이뤘다. '한우는 음머음머'팀은 가축 이미지 데이터를 활용해 36시간 만에 최소 평가 기준 대비 29% 향상된 정확도의 가축 AI 모델을 개발하는 성과를 거뒀다. 

정확도 부문 1위에 오른 '한우는 음머으머'팀. (왼쪽부터) 서윤지 팀원, 박준형 팀장, 김서하 팀원

'한우는 음머음머'팀은 평소 개발자 역량을 향상시키기 위해 기회가 될 때마다 AI 경진대회에 참가하고 있다. 특히 ADK2021은 키포인트 탐지(Keypoint detection)라는 익숙한 기술을 가축이라는 색다른 데이터에 활용할 수 있는 좋은 기회라고 생각해 대회에 참가했다. 가축 이미지 데이터는 이번 데이터톤에서 처음 접해봤지만, 사람 모델을 개발한 경험이 있어 가축 모델 개발에 큰 도움이 됐다.

박준형 팀장은 "사람 데이터로 학습된 모델과 동물 데이터로 학습된 모델을 모두 활용해봤는데 당연히 동물 데이터 모델이 더 좋을 거라는 생각과 달리, 사람 데이터로 학습된 모델이 전이학습 결과가 좋았다"라며 "현재 공개된 사람 데이터가 동물 데이터보다 개수도 많고, 퀄리티도 좋은 편이기 때문에 그 영향을 받은 것 같다"라고 말했다.

사람 모델을 가축 모델에 활용하는 과정에서 큰 애로사항은 없었다. 김서하 팀원은 "다른 데이터셋에 맞춰 모델을 학습시킬 때 가장 불편한 것 중 하나가 라벨링 양식이 안 맞는 경우지만 이번 대회는 라벨링 데이터를 대중적인 양식에 맞춰 잘 준비해주신 덕분에 별다른 어려운 점이 없었다"라고 밝혔다.

하지만 모델을 개발하는 과정은 순탄하지만은 않았다. 미리 주어진 학습 데이터는 황소 위주인 반면, 테스트 데이터에는 젖소와 흰소가 골고루 분포돼 있었기 때문이다. ‘한우는 음머음머’팀은 이러한 차이를 극복하기 위해 이미지 데이터를 증대시키는 '어그멘테이션(augmentation)' 방법을 찾는 데 집중했다. 최종적으로 이미지를 흑백화하는 방법을 통해 모델 성능을 크게 올릴 수 있었다.

개발 시간이 36시간에 불과한 것도 걸림돌 중 하나였다. 김서하 팀원은 "모델을 한번 학습시키는데 4시간 이상 소요되었기 때문에 다양한 방법론을 시도해보기엔 시간이 부족했다"라며 "결국 제한된 시간을 배분해 아이디어를 하나씩 적용해나가는 방식으로 대회가 마무리되는 순간까지 집중력을 유지할 수 있었다"라고 말했다.

처음 접해본 가축 데이터를 활용해 정확도 높은 모델을 단시간에 개발한 비결은 무엇일까. 

박준형 팀장은 "팀의 전략은 최대한 많은 데이터를 활용해보는 것이었다"라고 말했다. 그는 "사람 데이터뿐만 아니라 말(Horse-10), 호랑이(ATRW)와 같은 다양한 동물 데이터로 학습된 사적학습 모델들을 최대한 많이 활용해보려고 노력했다"라며 "계속 데이터를 살피면서 성능 개선을 위한 논의를 끊임없이 한 것이 유효했던 것 같다"라고 설명했다.

ADK2021 시상식에서 기념촬영한 '한우는 음머음머'팀과 경노겸 축산테크협회 대표(오른쪽 첫 번째)

ADK2021은 성장하는 축산테크 AI 분야를 체험하고 더 많은 관심을 불러오기 위해 마련된 행사다. 대회에 참가해 1위에 오른 '한우는 음머음머'팀은 축산테크에 대해 어떻게 느꼈을까. 이번 대회를 계기로 축산테크 AI 기술에 대한 흥미가 커졌다는 설명이다. 

김서하 팀원은 "이번 대회를 치르면서 축산테크 산업을 알게 됐고 축산 기업화 시대에 축산테크 산업이 굉장히 유망한 분야라고 느꼈다"라고 말했다.

서윤지 팀원은 "AI를 통해 가축 상태 파악해 인력 효율을 크게 향상시키는 것 등 여러 분야에서 다양한 가능성을 봤다"라고 밝혔다.

박준형 팀장은 "축산이라는 잘 공개되지 않은 데이터를 활용해 실제로 축산테크 산업에 사용할 수 있는 모델을 구현하는 과정이 매우 뿌듯하고 즐거웠다"라며 "제조업 등 소외된 여러 산업 영역에서도 데이터톤 개최가 활성화되길 기대한다"라고 말했다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.