20131231_001123

Apache Mahout

20131231_001123

Mahout 이란?

– 힌두어로 “코끼리를 모는 사람”이라는 뜻. Hadoop(하둡)의 로고가 코끼리인 것을 이용.
– Apache Lucene 프로젝트의 하위프로젝트로 시작되었다가, Open Source기반 협업 필터링 프로젝트 Taste를 흡수하면서 Apache Mahout으로 발전.
– 하둡을 기반으로 맵리듀스(Map Reduce)를 이용해 클러스터링, 분류, 분석 작업을 수행할수 있음.
– 대용량 데이터분석이 가능하며 확장성을 제공하는 기계학습 라이브러리.

 

제공되는 분석 기능들

– 협업 필터링
– 분류 : 특정 아이템이 어떤 분류에 속하는지 예측
– 클러스터링 : 비슷한 아이템들끼리 그룹핑
– 패턴 마이닝 : 빈번하게 발생하는 패턴을 찾음
– 그외에 회귀분석, 진화알고리즘, 벡터유사도 등 다양한 분석기능 제공

(주)리화이트 대표 / CEO & Founder

Next ArticleLinux (CentOS 6.4) 설치