컬렉션

기계 학습은 시민 과학자를 돕습니다

기계 학습은 시민 과학자를 돕습니다

기계 학습은 일반적으로 시민 과학자에게 제공되는 연구 작업을 완료하는 데 도움이 될 수 있습니다. 새로운 연구는 대량의 이미지 데이터를 분류해야하는 프로젝트에서 컴퓨터 특정 이미지 인식 기술을 가르치는 방법을 사용하는 방법을 보여줍니다.

다음 사항도 참조 : GOOGLE FLIGHTS는 머신 러닝을 사용하여 항공사 이전에 비행 지연을 예측합니다.

수년 동안 과학자들은 소규모 연구 팀에 비해 너무 큰 방대한 데이터 세트를 분류하는 데 도움이되는 자원 봉사자를 활용했습니다. 이전에는이 ​​작업을 기계가 수행하는 기술이 존재하지 않았기 때문에 인간이 수행해야했습니다.

생태 학자와 팀을 이룬 연구원

그러나 그것은 모두 변할 것입니다. 기계 학습 아이디어를 테스트하기 위해 연구원들은 카메라 트랩으로 야생 동물을 연구하는 생태 학자와 협력했습니다. 이 '트랩'은 모션 및 적외선 센서에 의해 트리거되는 숨겨진 카메라로 생태학자가 특정 연구에 사용할 이미지를 제공합니다.

그러나 모든 결과 이미지를 검토하고 분류해야 분석에 유용한 데이터를 제공 할 수 있습니다. 종종이 작업은 필요한 시간 내에 작업을 완료 할 수있는 훈련 된 자원 봉사자에게 제공됩니다. 그러나 새로운 연구는 자원 봉사자들을 컴퓨터로 대체합니다.

시민 과학자는 항상 가치있을 것입니다

"과거에는 연구자들이 시민 과학자들에게 합리적인 시간 내에 이미지를 처리하고 분류 할 수 있도록 도와달라고 요청했습니다."최근 미네소타 대학교 데이터 과학 석사 프로그램을 졸업 한 마르코 윌리가 말했다. 대학의 물리학 및 천문학 학교.

"현재 이러한 최근 카메라 트랩 프로젝트 중 일부는 수백만 개의 이미지를 수집했습니다. 시민 과학자의 도움으로도 모든 이미지를 분류하는 데 수년이 걸릴 수 있습니다.이 새로운 연구는 기계 학습 기술이 크게 도움이 될 수 있다는 개념 증명입니다. 분류 시간을 줄이십시오. "

이러한 경우 머신 러닝 기술이 가치가있을 수 있다는 이론을 테스트하기 위해 과학자들은 아프리카에서 가져온 세 개의 이미지 데이터 세트 (Snapshot Serengeti, Camera CATalogue, Elephant Expedition)와 Snapshot Wisconsin에서 북미에서 수집 된 이미지가있는 데이터 세트를 수집했습니다.

컴퓨터는 윤곽선과 색상으로 학습하기 시작합니다.

각 데이터 세트에는 9 ~ 55 종 사이의 종이 포함되었습니다. 데이터 세트는 또한 각 종의 사진 촬영 방법, 카메라 배치, 카메라 구성 및 종 범위에서 다양했습니다. 그런 다음 컴퓨터는 이미 인간에 의해 분류 된 데이터 세트의 이미지를 보여줌으로써 이미지를 분류하는 방법을 배웠습니다. 예를 들어, 기계에는 멧돼지의 전체 및 부분 이미지가 표시됩니다. 그런 다음 컴퓨터는 이미지에서 흑 멧돼지의 가장자리와 색상을 인식하기 시작하여 올바르게 분류 할 수 있습니다.

컴퓨터는 또한 동물이없는 사진을 식별 할 때도 배웠는데, 이는 바람이 카메라를 작동시킬 때 발생합니다. 이러한 'enpty'사진을 신속하게 제거 할 수 있으면 전체 분류 작업의 속도를 크게 높일 수 있습니다.

분류 프로젝트가 크게 빨라졌습니다.

"우리의 기계 학습 기술을 통해 생태학 연구자들은 이미지 분류 프로세스의 속도를 높이고 향후 더 큰 규모의 시민 과학 프로젝트를위한 길을 닦을 수 있습니다."라고 Willi는 말했습니다. "모든 이미지를 여러 자원자에 의해 분류해야하는 대신 한두 명의 자원자가 컴퓨터의 분류를 확인할 수 있습니다."

이미지 분류에서 기계 학습 기술의 능력에 대한이 테스트는 카메라 트랩의 동물 이미지에 초점을 맞추었지만 연구원들은 동일한 아이디어가 우주 및 생물학과 같은 시민 과학자와 관련된 다른 과학 분야에도 적용될 수 있다고 말합니다.

연구 공동 저자 인 미네소타 대학 물리학 및 천문학 교수이자 최대 시민 과학 인 Zooniverse의 공동 설립자 인 Lucy Fortson은 "광범위한 과학 분야의 데이터가 시민 과학 프로젝트 자원 봉사자 수보다 훨씬 빠르게 증가하고 있습니다."라고 말했습니다. 연구 프로젝트를 호스팅 한 온라인 플랫폼입니다.

"이러한 프로젝트에는 항상 인간의 노력이 필요하지만 이러한 노력을 빅 데이터 기술의 도움으로 결합하면 연구원이 더 많은 데이터를 더 빠르게 처리하고 자원 봉사자들이 더 어렵고 희귀 한 분류에 집중할 수 있습니다."


비디오보기: CORAL 6F-60 (일월 2022).