Apache Mahout 0.11.1 发布,机器学习库

2015年11月09日 08:10 186 次阅读 来源: 开源中国 作者: 路人甲
摘要 Apache Mahout 是 Apache Software Foundation ASF 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。该项目已经发展到了它的最二个年头,目前只有一个公共发行版。Mahout 包含许多实现,包括集群、分类、CP 和进化程序。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地...

        Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。该项目已经发展到了它的最二个年头,目前只有一个公共发行版。Mahout 包含许多实现,包括集群、分类、CP 和进化程序。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。


        Mahout 项目是由 Apache Lucene(开 源搜索)社区中对机器学习感兴趣的一些成员发起的,他们希望建立一个可靠、文档翔实、可伸缩的项目,在其中实现一些常见的用于集群和分类 的机器学习算法。该社区最初基于 Ngetal. 的文章 “Map-Reduce for Machine Learning on Multicore”,但此后在发展中又并入了更多广泛的机器学习方法。


Apache Mahout PMC 发布了 Mahout 0.11.1 版本,现已提供下载:http://www.apache.org/dist/mahout/0.11.1/  


Mahout 0.11.0 扩展了与 Spark 版本的兼容性,引入了一些新特性和 bug 修复。Mahout 0.11.1 相比 Mahout 0.11.0 改进如下:

Spark 1.4+ 支持
Dot Product 4x 性能提升
基于 matrix flaors 的 %*% 优化
详细改进请看发行说明。


Mahout 的目标还包括:

建立一个用户和贡献者社区,使代码不必依赖于特定贡献者的参与或任何特定公司和大学的资金。

专注于实际用例,这与高新技术研究及未经验证的技巧相反。

提供高质量文章和示例。

还可以输入136 讨论区:
评 论