你应该知道的10个人工智能开源工具AI学院

来源:未知 / 作者:zz / 2018-09-07 13:22
“AI机器人” “人工智能”近两年这些词汇频繁的出现在大众视野,而关于人工智能方面的人才也一度短缺,人工智能也变成了热门学习专业。下面是几个关于人工智能的开源工具,希望

“AI机器人” “人工智能”近两年这些词汇频繁的出现在大众视野,而关于人工智能方面的人才也一度短缺,人工智能也变成了热门学习专业。下面是几个关于人工智能的开源工具,希望对正在学习AI的你有所帮助~

 

1. Caffe

 

最初由贾扬清在加州大学伯克利分校的读博时创造的,后来由伯克利AI研究公司(BAIR)和社区贡献者联合开发。Caffe 是一个基于表达体系结构和可扩展代码的深度学习框架。使它声名鹊起的是它的速度,这让它受到研究人员和企业用户的欢迎。根据其网站所言,它可以在一天之内只用一个 NVIDIA K40 GPU 处理 6000 万多个图像。对于计算机视觉相关的任务来说,Caffe是一个不错且较为流行的选择,您可以在Caffe Model Zoo上注册,下载很多已经成功建模的模型,直接用于开发。

 

2. CNTK

 

CNTK 是一个微软的开源人工智能工具。不论是在单个 CPU、单个 GPU、多个 GPU 或是拥有多个 GPU 的多台机器上它都有优异的表现。微软主要用它做语音识别的研究,但是它在机器翻译、图像识别、图像字幕、文本处理、语言理解和语言建模方面都有着良好的应用。

 

3. Deeplearning4j

 


 

Deeplearning4j 是一个 java 虚拟机(JVM)的开源深度学习库。它运行在分布式环境并且集成在 Hadoop 和 Apache Spark 中。这使它可以配置深度神经网络,并且它与 Java、Scala 和 其他 JVM 语言兼容。

功能

1.分布式 cpu 和 gpu

2.Java, Scala and Python APIs

3.适用于微服务体系结构

4.通过降低迭代次数进行并行训练

5.在Hadoop 上可伸缩

6.在AWS扩展上提供Gpu 支持

1.Deeplearning4J: 神经网络平台

2.ND4J: Numpy for the JVM

3.DataVec:机器学习ETL操作的工具

4.JavaCPP:Java和C ++之间的桥梁

5.Arbiter:机器学习算法的评估工具

6.RL4J:JVM的深度增强学习

 

4. DMTK

 

和 CNTK 一样,是微软的开源人工智能工具。作为设计用于大数据的应用程序,它的目标是更快的训练人工智能系统。它包括三个主要组件:DMTK 框架、LightLDA 主题模型算法和分布式(多义)字嵌入算法。为了证明它的速度,微软声称在一个八集群的机器上,它能够“用 100 万个主题和 1000 万个单词的词汇表(总共 10 万亿参数)训练一个主题模型,在一个文档中收集 1000 亿个符号,”。这一成绩是别的工具无法比拟的。

 

5. H20

 

相比起科研,H2O 更注重将 AI 服务于企业用户,因此 H2O 有着大量的公司客户,比如第一资本金融公司、思科、Nielsen Catalina、PayPal 和泛美都是它的用户。它声称任何人都可以利用机器学习和预测分析的力量来解决业务难题。它可以用于预测建模、风险和欺诈分析、保险分析、广告技术、医疗保健和客户情报。

 

它有两种开源版本:标准版 H2O 和 Sparking Water 版,它被集成在 Apache Spark 中。也有付费的企业用户支持。

 

6. MLlib

 

由于其速度,Apache Spark 成为一个最流行的大数据处理工具。MLlib 是 Spark 的可扩展机器学习库。它集成了 Hadoop 并可以与 NumPy 和 R 进行交互操作。它包括了许多机器学习算法如分类、回归、决策树、推荐、集群、主题建模、功能转换、模型评价、ML 管道架构、ML 持久、生存分析、频繁项集和序列模式挖掘、分布式线性代数和统计。

 

7. OpenNN

OpenNN是一个用c++编写的开源类库,它实现了神经网络建模。它的关键特性包括深度的架构和快速的性能。其网站上可以查到丰富的文档,包括一个解释了神经网络的基本知识的入门教程。OpenNN 的付费支持由一家从事预测分析的西班牙公司 Artelnics 提供。

OpenNN旨在从数据集和数学模型中进行学习。

数据集:特征回归/ 模式识别/ 时间序列预测

数学模型:最佳控制/ 最佳形状设计

数据集和数学模型:反向问题
 

8. SystemML

 

最初由 IBM 开发, SystemML 现在是一个 Apache 大数据项目。它提供了一个高度可伸缩的平台,可以实现高等数学运算,并且它的算法用 R 或一种类似 python 的语法写成。企业已经在使用它来跟踪汽车维修客户服务、规划机场交通和连接社会媒体数据与银行客户。它可以在 Spark 或 Hadoop 上运行。

SystemML的重要特点如下:

1.使用类R和类Python语言定制算法。

2.有多种执行模式,包括Spark MLContext、Spark Batch、Hadoop Batch、Standalone和JMLC(Java机器学习连接器)。

3.基于数据和聚类特性的自动优化,保证了算法的高效率和可扩展性。

4.将SystemML视为机器学习的结构化查询语言SQL。SystemML的最新版本(1.0.0)支持:Java 8+、Scala 2.11+、Python 2.7/3.5+、Hadoop 2.6+以及Spark 2.1+。

5.可在Apache Spark上运行,在Apache Spark上,SystemML通过逐行查看代码,确保代码是否能够在Apache Spark聚类上运行。

未来对SystemML的开发将包括:使用GPU进行额外的深度学习,例如导入和运行神经网络架构以及用于训练的预训练模型。

 

9. TensorFlow

 

TensorFlow 是一个谷歌的开源人工智能工具。它提供了一个使用数据流图进行数值计算的库。它可以运行在多种不同的有着单或多 CPU 和 GPU 的系统,甚至可以在移动设备上运行。它拥有深厚的灵活性、真正的可移植性、自动微分功能,并且支持 Python 和 c++。它的网站拥有十分详细的教程列表来帮助开发者和研究人员沉浸于使用或扩展他的功能。

一些使用Tensorflow的Google应用有:

1.RankBrain在www.google.com上大规模部署用于搜索排名的深度神经网络。

2.Inception图像分类模型:基准模型和对高度精确的计算机视觉模型的后续研究,它是在获得2014年Imagenet图像分类挑战赛的模型基础之上进行构建的。

3.SmartReply:可自动生成电子邮件响应的Deep LSTM模型。

4.Massively Multitask Networks for Drug Discovery:Google与斯坦福大学合作的识别有效候选药的的深度神经网络模型。

5.用于OCR的设备级计算机视觉:基于设备级的计算机视觉模型实现光学字符识别,进行实时翻译。
 

10. Torch

 

Torch 将自己描述为:“一个优先使用 GPU 的拥有机器学习算法广泛支持的科学计算框架”,它的特点是灵活性和速度。此外,它可以很容易的通过软件包用于机器学习、计算机视觉、信号处理、并行处理、图像、视频、音频和网络等方面。它依赖一个叫做 LuaJIT 的脚本语言,而 LuaJIT 是基于 Lua 的。

功能

1.一个强大的 n 维数组

2.有很多索引、切片、转换的程序。

3.可使用 LuaJIT编写简单的C扩展。

4.线性代数程序

5.神经网络和基于能量的模型

6.数字优化程序

7.GPU支持,更加快速和高效

8.可嵌入,带有 iOS 和 Android 的后台端口
 

阅读延展

1
3