[BIG DATA] AutoML특집 (1부)- AutoML이란 무엇인가

 

전 세계 기업 및 조직들의 가장 중요한 화두는 데이터입니다. 데이터는 이미 폭발적으로 증가하고 있으며, AI, 빅데이터, IoT, 5G 등에 대한 투자가 더욱 가속화되면서 데이터 증가 속도는 더욱 탄력을 받게 될 것입니다.

 

새로운 비즈니스 가치를 찾고 경쟁 우위를 확보하려면, 비즈니스 활동을 통해 축적한 많은 양의 데이터를 신속하고 정확하게 분석하여 활용하는 일이 이제 선택이 아닌 필수가 되었습니다. 즉, 데이터를 통한 기업의 혁신과 성장은 필연이라고 할 수 있겠습니다.

 

코로나19로 우리가 잘 아는 온라인 사업, 교육, 화상회의, 배송, 간편식 등 IT 기술을 기반으로 한 언텍트 비즈니스가 빠르게 성장하고 있다고 합니다. 언텍트 비즈니스의 핵심 기반 및 경쟁력은 데이터 및 지능화로, 코로나19는 기업의 생존과 성장을 위한 디지털 전환을 가속화 시키고 있으며, AutoML은 그 변화에 필요한 기술 요소 중에 하나라고 볼 수 있겠습니다.

 

 

 

 

AutoML이란

Automated Machine Learning (AutoML)은 기계 학습 파이프 라인에서 수작업과 반복되는 작업을 자동화하는 프로세스입니다. AutoML솔루션은 최근 몇 년간 가장 빠르게 진화하는 기술 중 하나로, 예측 모델 개발에 많은 시간을 소요했던 코딩, 알고리즘 선택, 튜닝 작업을 자동화합니다.

 

코드 한줄, 버튼 클릭 또는 머신러닝 스스로를 통하여 그 동안 복잡했던 수작업, 반복적이었던 작업들은 자동으로 처리해주기 때문에 AutoML을 사용하면 매우 쉽고 효율적으로 원하는 결과값을 얻을 수 있습니다. AutoML은 데이터 과학자, 머신러닝 엔지니어 및 연구원의 생산성을 크게 향상시킬 수 있으며, 머신러닝 활용과 접근이 힘들었던 비즈니스 사용자(비전문가)의 접근성과 활용성을 높여줍니다.

 

 

 

AI를 만드는 AI, AutoML은 어떻게 변화해 왔을까요?

머신러닝은 과거로부터 누적된 데이터를 기반으로 수학적 알고리즘을 만들어 컴퓨터가 스스로 생각하도록 만드는 AI 기술입니다. 이 과정에서 예측 가능성이 가장 높은 규칙을 찾기 위해 모델 평가 지표를 수립하고, 알고리즘 선택, 모델링, 평가, 보완에 이르는 작업을 반복적으로 수행합니다. 이와 같은 불편을 해결하기 위해 등장한 것이 바로, ‘AutoML(자동머신러닝)’. 즉, 머신 러닝을 자동화하는 AI기술입니다.

 

AutoML의 시작은 학습에 필요한 학습률, 배제율 등 초매개변수(hyperparameter)를 최적화하여 더 나은 모델을 학습시키는 ‘하이퍼파라미터 최적화(Hyperparameter Optimization)’였습니다. 이후 학습을 통해 유의미한 변수(Feature)를 추출해서 사용하는 ‘피처 학습(Feature Learning)’으로 발전했고, 모델링 전체 프로세스를 사람이 하나 직접 설계하던 것에서 학습을 통해 최적의 아키텍처를 설계하는 ‘아키텍처 서치(Architecture Search)’로 발전해 왔습니다. 또한, 시간이 지남에 따라 이러한 파이프라인의 자동 유지 관리를 처리하도록 범위가 확대되어 모델의 자율성이 증가하고 있습니다.

 

AutoML 자동화의 발전단계 (출처: SAS KOREA)

 

 

 

AutoML의 관심도 증가

AutoML에 대한 관심을 살펴보면 2017 년 초부터 증가하는 추세를 볼 수 있습니다. AI 알고리즘의 발전, 자동화 등 AutoML은 많은 관심과 기대를 가지고 있는 트렌드임을 알 수 있습니다.

 

 

AutoML 관심도 증가표 (출처:ㅣ Google Trend)

 

Gartner는 2020년 10대 전략 기술 트렌드를 발표 하면서 “데이터 과학 작업의 40 % 이상이 2020년까지 자동화 될 것이다.” 라고 예측을 했습니다. 실제로 인공지능과 머신러닝 기반의 데이터 과학 작업에 대한 요구는 증가하고 있으며 AutoML 솔루션과 서비스는 점점 더 자동화되고 대중화되고 있습니다.

 

2020, AI 시대의원년

기업들은 그동안 엔터프라이즈 시장에서 AI 기술이 추상적인 개념으로만 활용되거나 일차원적으로 구현되는 수준에 그쳤다면, 올해는 실제 서비스와 제품으로 만나볼 수 있게 될 것으로 분석하고 있습니다.

 

IDC는 오는 2025년까지 새롭게 개발되는 애플리케이션의 90%에 AI 기술이 적용될 것으로 예측했으며, 아태지역에서 AI 시스템에 대한 지출 규모는 2020년 22억 달러에서 2023년 214억 달러로 급격하게 증가할 것으로 전망하고 있습니다. 2020년은 국내 시장에서도 본격적으로 AI 사업이 확대되는 원년이 될 전망입니다. 최근 과학기술정보통신부는 디지털뉴딜을 발표하며, AI 등에 4915억원을 투입, 모든 산업에 디지털 혁신을 확산시켜 데이터 경제를 가속화한다고 밝혔습니다.

 

 

 

AutoML 왜 필요한가?

새로운 비즈니스 가치를 찾고 경쟁 우위를 확보하려면, 비즈니스 활동을 통해 축적한 많은 양의 데이터를 신속하고 정확하게 분석하여 활용하는 일은 이제 선택이 아닌 필수가 되었습니다. 즉, 데이터를 통한 기업의 혁신과 성장은 필연이라고 할 수 있겠습니다.

 

인공지능(AI), 머신러닝 등의 최신 기술을 활용한 디지털 전환(Digital Transformation)에 대해 높은 관심이 이어지며, 인공지능(AI) 머신러닝 기술을 결합한 대용량 데이터 분석이 많은 조직으로 확산될 전망입니다. 이에 따라 데이터 사이언티스트와 비즈니스 사용자, 현업이 함께 같이 경험과 소통을 할 수 있는 툴이 필요합니다.

 

AutoML은 프로세스를 자동화를 통하여 전문 지식 없이도 기업 구성원 누구나 몇 번의 마우스 클릭만으로도 손쉽게 머신러닝을 활용할 수 있기 때문에 전문 인력이 부족한 기업에게는 좋은 선택입니다. 또한 데이터 사이언티스트들도 더 짧은 시간에 더 많은 모델을 구축함으로써 모델 품질과 정확도를 개선하고, 보다 생산적인 일에 몰두하며 전문성을 강화할 수 있습니다.

 

 

 

기업환경에 적합한 AutoML을 선택하기 위해서는…

다양한 머신러닝 오픈 소스가 있지만, 플랫폼을 구성하기 위해서는 직접 개발이 필요합니다. 이에 전문 개발자를 많이 보유할 수 없는 일반 기업은 도입에 어려움이 따릅니다. 가트너에서는 SAS와 같은 기업에서 제공하는 범용적 상용 플랫폼에 주목할 필요가 있다고 강조합니다.

 

AutoML을 도입하기 위해서는 기업의 환경과 역량 정도 그리고 도입 목적에 따라 부합하는 검토 전략이 필요합니다. 특히, 비즈니스 사용자(현업) AutoML 통하여 기회와 경험을 축적하면서 데이터 사이언스 머신러닝 영역으로 확장을 해야 되며 자동화(AutoML) 포함하는 범용적 플랫폼 도입이 전략적이며 실용적인 대안이 될 수 있습니다.

 

 


 

 

지금까지 AutoML이 무엇인지에 대해 자세히 살펴보았는데요.

궁금증이 풀리셨나요?  ^^

 

다음 시간에는 기업환경에 적합한 AutoML 선택전략과 주요 기능에 대해 조금 더 상세히 다뤄보도록 하겠습니다.

 

 

 

 

 

<출처>

- SAS KOREA, SAS AI-Enhanced Analytics 브로슈어

- Microsoft, AutoML, https://docs.microsoft.com/ko-kr/azure/machine-learning/concept-automated-ml, 2020.04.22

- 한국정보화진흥원(NIA), 스페셜리포트 2020-3,

  https://www.nia.or.kr/site/nia_kor/ex/bbs/View.do?cbIdx=82618&bcIdx=21857&parentSeq=21857 ,2020.03.06

- 컴퓨터월드, 2020년 국내 주요 IT시장 전망, http://www.comworld.co.kr/news/articleView.html?idxno=49817, 2020.03.01

- 류은주(2020.07.19), 과기정통부 '디지털 뉴딜' 본격화…AI 등에 4915억원 투입, IT조선,

  http://it.chosun.com/site/data/html_dir/2020/07/19/2020071900769.html

- 김성수(2020.02.19), 데이터플랫폼, 손쉬운 관리와 접근성이 핵심, IT데일리, http://www.itdaily.kr/news/articleView.html?idxno=99949

- 이현재(2020.04.08), 삼일, "코로나19로 '언택트 디지털' 전환 가속화 될 것", 조세일보,

  https://www.joseilbo.com/news/htmls/2020/04/20200408395618.html

  • 예고구 2020.10.15 20:58 댓글주소 수정/삭제 댓글쓰기

    어려운 내용이었지만 올해가 중요한 시기이고 본격적으로 상용화가 된다는 이야긴가요
    데이터와 정보가 경쟁이 되는 시대

  • 홍영표 2020.10.16 23:58 댓글주소 수정/삭제 댓글쓰기

    좋은내용 잘 보고 갑니다

  • 장단콩 2020.10.18 23:09 댓글주소 수정/삭제 댓글쓰기

    AutoML 들어보기는 했지만 솔직히 제대로 알지 못했는데 정의부터 활용 선택 등 다양한 정보를 소개해 주셔서 정말 큰 도움이 되었습니다.