编译 | Debra
编辑 | Natalie
微信公众号“AI 前线”(ID:ai-front)
- Github 收藏平均数量:764⭐️
- 机器学习 Github Top10 开放源代码,https://github.com/Mybridge/machine-learning-open-source。
- 主题:NLP 架构、视频分类、Mlflow、经典游戏、Dragonfire、Opencv、计算机视觉、Star GAN、Glow、生成压缩
这些开源项目对程序员很有用,希望你能找到一个能引起你兴趣的有趣项目。
Top1 Nlp-architect
英特尔人工智能实验室的 NLP 架构:探索最先进的 NLP 深度学习拓扑和技术的 Python 库[Github 1194 颗星]
当前版本的 NLP Architect 包含了从研究角度和实际应用都非常有趣的特性:
- NLP 核心模型可以为 NLP 工作流程提供强大的语言特征提取功能:例如分析器(BIST)和 NP chunker
- 提供一流性能的 NLU 模块:例如意图提取(IE),名称实体识别(NER)
- 解决语义理解的模块:例如,内涵提取,最常见词义,NP 嵌入表示(如 NP2V)
- 会话式 AI 组件:例如 ChatBot 应用程序,包括对话系统,序列分块和 IE
- 使用新拓扑的端到端 DL 应用程序:例如 Q&A,机器阅读理解
感谢 Intel Nervana[英特尔人工智能实验室对 NLP 架构的介绍:
https://ai.intel.com/introducing-nlp-architect-by-intel-ai-lab/
github 链接:
https://github.com/NervanaSystems/nlp-architect
Top2 视频非局域网
Video-nonlocal-net:用于视频分类的非局部神经网络,用 Caffe2 开发[Github 592 颗星]
Facebook Research 介绍:https://medium.com/@FBResearch
论文地址:https://arxiv.org/pdf/1711.07971.pdf
GitHub 链接:
https://github.com/facebookresearch/video-nonlocal-net
Top3 Mlflow
整个机器学习生命周期的开源平台 [Github 1282 颗星]
目前的 MLflow 是 alpha 版本,意味着 API 和数据格式有可能发生变化,且不支持 Windows 运行。
GitHub 链接:
https://github.com/databricks/mlflow
Top4 Gym Retro
经典游戏强化学习平台 [Github 905 颗星]
OpenAI 使用 Gym Retro 来研究强化学习(RL)算法并研究泛化。 RL 之前的研究主要集中在优化代理解决单个任务上。 通过 Gym Retro,我们可以研究在概念相似但外观不同的游戏之间进行概括的能力。此外,OpenAI 还为新游戏添加了新的整合工具。
视频地址:https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/retro-heavy/output2.mp4
此版本包括世嘉创世纪和世嘉主系统的游戏,以及任天堂的 NES,SNES 和 Game Boy 游戏机。它还包括对世嘉 Game Gear,任天堂 Game Boy Color,任天堂 Game Boy Advance 和 NEC TurboGrafx 的初步支持。 一些已发布的游戏集成(包括 Gym Retro 的数据 / 实验文件夹中的那些游戏)处于测试状态。由于涉及的变化规模很大,代码暂时只能在一部分游戏上使用。
OpenAI 介绍:https://blog.openai.com/gym-retro/
GitHub 链接:
https://github.com/openai/retro/tree/develop
Top5 Dragonfire v1.0
基于 Ubuntu 的 Linux 发行版的开源 AI 助手 [Github 688 颗星]
支持环境:
Dragonfire 执行命令步骤:
- 搜索内置命令并评估代数表达式
- 尝试学习使用高级 NLP 和数据库管理技术
- 询问无所不知的 Q&A 引擎(感谢所有为维基百科做贡献的人)
- 使用 Deep Conversation 系统进行响应,这是一个使用 Cornell Movie-Dialogs Corpus 训练的 seq2seq 神经网络
Dragonfire 使用 Mozilla DeepSpeech 来理解你的语音命令,并使用 Festival Speech Synthesis System 来处理文本到语音的任务。
你可以到 Gitter 聊天室(https://gitter.im/DragonComputer/Lobby),或者 Twitter 帐户与 Dragonfire 体验亲自与她交谈的乐趣。
DRAGON.COMPUTER 介绍:
https://github.com/DragonComputer/Dragonfire
GitHub 链接:
https://github.com/DragonComputer/Dragonfire
Top6 FaceAI
人脸、视频、文字检测和识别项目(使用自动翻译器:中文 – >英文) [Github 1482 颗星]。
功能
- 人脸检测、识别(图片、视频)
- 轮廓标识
- 头像合成(给人戴帽子)
- 数字化妆(画口红、眉毛、眼睛等)
- 性别识别
- 表情识别(生气、厌恶、恐惧、开心、难过、惊喜、平静等七种情绪)
- 视频对象提取
- 图片修复(可用于水印去除)
- 图片自动上色
- 眼动追踪(待完善)
- 换脸(待完善)
开发环境
- Windows 10(x64)
- Python 3.6.4
- OpenCV 3.4.1
- Dlib 19.8.1
- face_recognition 1.2.2
- keras 2.1.6
- tensorflow 1.8.0
- Tesseract OCR 4.0.0-beta.1
GitHub 链接:
https://github.com/vipstone/faceai
Top7 Sod
嵌入式计算机视觉和机器学习库(CPU 优化和 IoT 功能)[Github 557 颗星]
SOD 是嵌入式的现代跨平台计算机视觉和机器学习软件库,公开了一套用于深入学习的高级媒体分析和处理 API,包括实时、多类别对象检测和嵌入式系统上的模型训练计算资源和物联网设备,旨在为计算机视觉应用提供通用基础设施,并加速在开源和商业产品中使用机器感知。
SOD 目前的计算机视觉算法支持但不限于移动机器人、AR/VR、基因学、人机交互、机器自动化等。
值得注意的 SOD 功能:
- 专为真实世界和实时应用程序而打造。
- 最先进的 CPU 优化深度神经网络,包括全新的独家 RealNets 架构。
- 无需专利,先进的计算机视觉算法。
- 支持主要的图像格式。
- 简单,干净且易于使用的 API。
- 深入了解有限的计算资源,嵌入式系统和物联网设备。
- 易于使用 OpenCV 或任何其他专有 API 进行插补。
- 预训练模型可用于大多数体系结构。
- 支持 CPU 的 RealNets 模型训练。
- 已完备、跨平台、高质量的源代码。
- SOD 是免费的,用 C 语言编写,几乎可以在所有平台和体系结构上编译和运行。合并 – 将所有 SOD 源文件合并为一个 C 文件(sod.c)以便于部署。
- 开源,积极开发和维护产品。
- 开发者友好的支持渠道(https://sod.pixlab.io/support.html)
SOD 编程指南:https://sod.pixlab.io/intro.html
Symisc Systems 主页介绍:https://sod.pixlab.io/
GitHub 链接:https://github.com/symisc/sod
Top8 StarGAN-Tensorflow
StarGAN 的简单 Tensorflow 实现(CVPR 2018 Oral)[Github 382 颗星],感谢 Junho Kim。
StarGAN 是一个使用单个数据集解决多域图像到图像转换问题的框架,可以合并包含不同标签集的多个数据集,并灵活地使用这些标签进行图像翻译。
论文链接:https://arxiv.org/pdf/1711.09020.pdf
GitHub 链接:
https://github.com/taki0112/StarGAN-Tensorflow
Top9 Glow
神经网络硬件加速器编译器 [Github 603 颗星],致谢 PyTorch。
Glow 是针对各种硬件目标而设计的机器学习编译器和执行引擎,被用作高级机器学习框架的后端。该编译器可以进行最先进的编译器优化和神经网络图的代码生成。这个库还在实验和发展阶段。
工作原理
Glow 将传统的神经网络数据流图降低到两阶段强类型中间表示(IR)。高级 IR 允许优化器执行特定域的优化。较低级别的仅基于指令的 IR 允许编译器执行与内存相关的优化,例如指令调度,静态内存分配和复制消除。在最底层,优化器执行特定机器代码生成,以利用其硬件特性。Glow 的降低阶段特点在于使编译器无需在所有目标上实现所有运算符,从而支持大量的输入运算符以及大量的硬件目标。降低阶段的设计旨在减少输入空间,让新的硬件后端专注于少数线性代数基元。其设计理念在 arXiv 论文中有所描述。
论文链接:https://arxiv.org/abs/1805.00907
GitHub 链接:
https://github.com/pytorch/glow
Top10 生成压缩
Generative-compression:GAN 极端学习图像压缩的 TensorFlow 实现。[Github 225 颗星],致谢 Justin-Tan。
Generative-compression 的方法由 Agustsson 等人在 Generative Adversarial Networks for Extreme Learned Image Compression 一文中提出。
论文链接:https://arxiv.org/pdf/1804.02958.pdf
GitHub 地址:
https://github.com/Justin-Tan/generative-compression
原文链接:
https://medium.mybridge.co/machine-learning-open-source-projects-of-the-month-v-june-2018-d87e2ca3e13f
本文为专栏文章,来自:AI前线,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/56938.html 。