티스토리 뷰


다음 중문 기사를 한글로 번역함.


https://yq.aliyun.com/articles/72847?spm=5176.100241.0.0.fLUBu4





알리바바 클라우드 기계학습 - 인공지능을 손끝에 가능하게 하다 - (1) 


                  

초록:  가까운 장래에 알리바바 클라우드는 자회사 기계학습 플랫폼을 정식으로 상용화해서 배포할 계획이다. 기계학습이라고 하면, 안면 인식 지불, 지능형 맨-머신 인터페이스, 지능형 맞춤형 상품 추천 등의 시나리오를 곧바로 연상하게 된다. 기계 학습 알고리듬이 이러한 인공지능 애플리케이션의 기반 알고리듬을 지원한다. 본 기사에서는 알리바바가 어떻게 자체 인공지능 플랫폼을 구축했는 지, 이 플랫폼의 특징 및 지원하는 알고리듬, 그리고 해결할 수 있는 문제에 대해서 상세히 설명한다.


1.서론

가까운 장래에 알리바바 클라우드는 자회사 기계학습 플랫폼을 상용화하여 배포할 계획이다.  기계학습이라고 하면 여러 사람들에게 좀 혼동스러울 수도 있겠지만, 인공지능 뿐만이 아니라, 안면 인식 지불, 지능형 맨-머신 인터페이스, 지능형 맞춤형 상품 추천 등의 장면을 연상하게 된다. 기계학습 알고리듬은 바로 이러한 인공지능 애플리케이션의 기반 알고리듬을 지원한다.


최근 몇 년간, 기계학습은 뜨거운 발전 추세를 보이고 있으며, 주로 딥러닝 기술에서 상당한 발전을 이루었으며, 요약하면 다음과 같이 크게 3가지 요소로 요약된다.

  • 데이터: 인터넷에서 대량의 데이터, 이미지, 음성, 동영상, 또는 각종 센서에서 생성되는 데이터가 매일 생성되며, 예시로 각종 위치 정보, 웨어러블이 있다; 구조화되지 않은 텍스트 데이터도 중요한 구성 부분이다. 데이터가 많을 수록, 우수한 모델을 딥러닝이 쉽게 표현하게 된다.

  • 대규모 분산 고성능 컴퓨팅 성능의 향상: 최근 몇 년간, GPU 고성능 컴퓨팅, 분산 클라우드 컴퓨팅 등 컴퓨팅 플랫폼은 맹렬하게 발전하여, 대규모의 데이터 마이닝 및 데이터 모델링이 가능하게 되었으며, 그리고 딥러닝의 비약을 위하여 기반 인프라를 만들었다; 알리바바 클라우드의 염원 중 하나는 바로 물과 전기 매체 처럼 기반 인프라가 되는 것이다.

  • 알고리듬적 혁신: 데이터 및 컴퓨팅 성능의 향상에 따라, 알고리듬 자체도 크나큰 발전이 있었고, 특히 딥러닝 방면에서는 뇌신경학에서 얻은 영감, 활성함수로 인한 희소성의 처리 등등의 예시가 있다. 


위에 언급한 3가지로 인하여, 인공지능은 제2의 봄을 맞게 되었다. 인공지능은 더 빠른 속도로 우리들의 직장 및 생활 속에 파고 들어와서, 우리들의 눈, 귀가 되어 더 빠르고 민첩하게 정보를 얻도록 돕고, 결정을 내리도록 보조하게 될 것이다. 알리바바 클라우드 기계학습 플랫폼 제품은 이로 인하여 반복프로세스(iterative process)를 생산 및 가속화하며, 기술 발전을 촉진한다. 아래 도면에 우리는 알리바바 클라우드 기계학습 플랫폼 프래임워크 도면과 해당 기능을 대조하며 설명을 하고자 한다.


c0f226c26f86a034555ecc7afcc4396fdaceffb2


알리바바 클라우드 기계학습 프레임워크 도면


알리바바 클라우드 기계학습의 플랫폼의 기반 인프라 및 컴퓨팅 프레임워크는 알리바바 클라우드의 페이티엔(飞天) 컴퓨팅 플랫폼 위에 구축되어 있으며, MR, SQL, MPI, PS, GRAPH 같이 모두 5종류의 분산 컴퓨팅 프레임워크를 지원하며, 기반 인프라 층의 CPU 및 GPU 컴퓨터 클러스터링을 유연하게 호출할 수 있다. 그 외에도, 모델링 및 알고리듬 층에서 알리바바 클라우드 기계 학습은 데이터 선행처리(preprocessing), 특징 엔지니어링(feature engineering), 기계학습 알고리듬, 딥러닝 프레임워크, 모델 평가 및 예측 등 전체 데이터 마이닝 프로세스 흐름의 모든 세트를 포함한다.


e1c2ac0674440d347db96069af662129a12feb7a

알고리듬 프로세스 흐름


비지니스 애플리케이션 층에서, 알고리듬 개발자는 알리바바 클라우드 기계학습 플랫폼에 기반하여 질병예측, 금융 리스크 관리, 뉴스 분류 등과 같은 각종 시나리오에 대응하는 애플리케이션을 손쉽게 구축할 수 있다.