我在Google用AI研究基因,入门从吴恩达的课程开始

我在Google用AI研究基因,入门从吴恩达的课程开始
2017年11月19日 13:30 量子位

允中 编译 Google博客 

量子位 出品 | 公众号 QbitAI

Google AI入驻计划,是一项为期12个月的研究培训项目,希望帮助不同领域的科学家和研究员,掌握机器学习和AI的方法。

最近,该计划中的常驻生物学家Suhani Vora,与外界分享了Google AI入驻计划的内部情况。比如他们如何学习机器学习、如何利用AI相关的方法推进研究。

这其中可能有一些值得借鉴的地方。

Q:你是如何把机器学习与基因研究结合起来的?

Suhani Vora:在之前的研究中,我主要围绕CRISPR / Cas9系统的工程设计,展开基因组研究,虽然我知道通行的生物学方法,是比较有效的基因组编辑工具,但也有一些“端倪”,让我知道可以把研究推进得更快。

其中一个很重要的环节,是预测新型生物设计中的作用因子。在每个设计周期中,我们使用之前搜集的非常少的数据,并依靠对这些数据的解析,来解释实验室各项数据结果。

由于缺乏强大的计算方法来利用大数据,以及帮助设计整个工作流程,我们的研究进展始终受限。

但之后了解到机器学习的原理,毫无疑问,如果能够将我们的研究与机器学习结合,必然能大大提升效率,所以我们决定将机器学习应用到基因工程研究中。

起步阶段,最关键的是进一步了解机器学习的原理。于是在Google员工的推荐下,我把Coursera上吴恩达(Andrew Ng)的机器学习课程学习了一遍,有了不少入门知识和乐趣,如果现在让我推荐入门课程,我想没有比吴恩达的课程更好的了。

其后,有了基础知识和乐趣,我又开始学习MIT的机器学习课程,并阅读基因组研究和深度学习结合的相关论文,这促使我进一步对想做的事情有了更深入的认知,并最终让我在研究院毕业后能够进入Google AI入驻计划。

Q:能介绍下你的工作吗?

Suhani Vora:我是一名跨学科的深度学习研究员,我利用编程、深度学习,去探索他们对基因组问题的适用性。

举个例子,就像众所周知用机器学习模型去做图像识别一样,我研究如何用神经网络自动预测DNA序列的属性,这其中还会有各种各样的应用:比如预测DNA突变是否会诱发癌症等。

Q:典型的一天生活是什么样的?

Suhani Vora:在每一天的工作中,我基本都是通过编写代码来处理新的基因组数据,或在TensorFlow中创建神经网络来模拟数据,我现在在这些模型上花费不少时间。

我还会花时间与其他成员\TensorFlow团队成员聊天,以获知他们的进展。其中还包括了与两位Google导师会面,Mark DePristo和Quoc Le都是机器学习方面的大咖,他们会定期为我搭建的神经网络模型给于指导。

Q:你认为机器学习对知识背景有要求吗?

Suhani Vora:Google AI入驻计划中,背景太广泛了。我看到的共同点是:大家都对机器学习有强烈的兴趣,或者将机器学习应用到特定的领域。

另外,我认为在线性代数、统计学、计算机科学,以及建模方面的专业背景,会让整个工作更简单一些,但并不是意味着不能从现在开始,因为你可以通过MOOCs这样的在线学习平台进行学习。

Q:你认为AI能为世界解决什么样的问题?

Suhani Vora:我想这与目的有关。取决于我们如何创造AI,以及利用AI为我们做些什么。目前,深度学习方法已经被广泛用于图像识别、自然语言处理、语音识别等领域,我们已经从自动检测宠物,中英文自动翻译中受益。

未来,我想在机器人处理和医学领域,也将出现一批造福人类的AI应用。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部