数据集
-
深度学习在视觉上的局限性以及我们如何对付它们
深度学习在视觉领域取得了巨大的成功,即便如此,深度学习在视觉上仍然有很多的局限性,这篇文章从深度学习的历史开始说起,阐述了深度学习在视觉上的局限性,并给出了一些可能的方案。
-
乳腺癌预测模型只有白人女性数据,MIT刚刚把它扩展到了所有族裔
乳腺癌预测模型只有白人女性数据,MIT刚刚把它扩展到了所有族裔。
-
如何为学习,实验和教学生成有意义的人造数据集?
如果你从事教学或喜欢实验,不想使用老套的数据集,fakir是一个非常好的值得了解的包。
-
你真的对你构建的ML模型足够了解么?
我们真的了解在我们构建的ML模型中发生了什么吗?让我们来探索吧。
-
网易数读:我们分析了10万条泄露密码,发现了这样的套路
我们根据公布的10万条密码进一步分析,发现了诸多亮点。
-
四万字歌词分析:那些年,我们一起追的五月天到底在唱什么?
看看这些年陪伴我们的这五月天,到底在唱些什么?
-
是什么使GPU数据库成为BI的理想选择?
全球组织正面临着有效分析其指数级增长数据存储的挑战。由于我们面临着巨大新比例的数据存储,“大数据”这个词已经过时了。
-
基于深度学习的目标检测算法综述:常见问题及解决方案
基于深度学习的目标检测算法综述分为三部分:1. Two/One stage 算法改进。2. 解决方案。3. 扩展应用、综述。
-
如何在R中执行Logistic回归?
逻辑回归是拟合回归曲线的方法,当y是分类变量时,y = f(x)。这个模型的典型用途是基于一组预测变量x预测y。预测因子可以是连续的,分类的或两者的混合。
-
使用 Python 分析 14 亿条数据
Google Ngram viewer是一个有趣和有用的工具,它使用谷歌从书本中扫描来的海量的数据宝藏,绘制出单词使用量随时间的变化。
-
济南政府大数据向社会开放,涵盖53个部门千余数据集
1月5日下午,济南市政府数据开放平台正式运行。作为全国首个以两办文件推进政府数据开放的城市,济南市政府数据开放平台首次开放就公开了53个部门的1010个数据集,成为全国一次性开放单位最多、数据集最大的城市。
-
弱监督下的神经排序模型,慎重向机器人工输入特征,不要扼杀模型的创造力!
近年来,无监督的深度神经网络在计算机视觉技术、自然语言处理和语音识别任务上都已经取得了很大的进步,而在信息检索的排序上却仍在原地踏步,没有太大的改进。其中的原因可能在于排序问题本身的复杂性,因为在没有监督信号的情况下,神经网络很难从查询内容和文档中获取信息。因此,我们在这篇文章中提出了使用“弱监督”来训练神经排序模型。也就是说,所有训练所需的标签都是机器自己…
-
数据集市的挑战是识别和处理数据安全
你怎么知道哪些数据需要保护?
-
猫奴的自我修养,教你如何用机器学习识别猫的品种
如何用机器学习算法能否判断猫的品种?
-
20万、50万、100万的算法工程师,到底有什么区别?
作者:北冥乘海生 来自:https://zhuanlan.zhihu.com/p/27072134 公元七世纪,在车迟国国家气象局组织的一次求雨活动中,虎力、鹿力、羊力三位大仙成功地祈下甘霖,于水火中救了黎民。老国王虽然不明就里,却从此尊他们为国师,奉道教为圭臬。 本世纪,算法工程师们的境遇也差不多:早些年,信奉糙快猛主义的大佬们觉得他们饱食终日、无所用心,…