Raj Bondugula博士预计在未来数据提取、转换和加载工具(ETL)都将不再具有任何市场前景了,因为他们都将被Hadoop替代。Hadoop在博士眼里是当今世界最有前景的数据科学工具,当然还有它的一些“家庭成员”——Mahout、HDFS等。正是这些工具的存在让越来越多具有挑战性的工作(例如并行计算)相对容易起来,虽然也算不上简单。说到Hadoop前景,他同样预言可能会有MapReduce以外的很多其他大数据分析理念出现,而它们都将被广泛地运用到大数据分析中。
对于Raj Bondugula博士来说,在数据科学领域最有挑战性的事情,其实这可能也是整个数据分析领域需要面对的巨大挑战,就是如何从海量的数据中找到合适的问题去入手分析,以及获得有价值有意义的结果。诸如“这批数据有什么价值?”之类的开放式问题可能在未来不再流行了,因为你并不能以此获得具有洞见的结论(即使结果是正确的)。他相信任何假设的来源一定要基于商业知识。而这就需要更高的创新能力,在这方面人类的直觉和能力是计算机完全无法替代的。
从他个人来说,Bondugula博士却是一个非常自信的人,虽然他知道很多技术或者领域知识都需要从皮毛开始一层一层地学下去,但是他觉得数据科学这个领域是很好的。正如大家所期待的那样,他计划在未来的很多年都从事这一行业。
給出的建议:
“在某个方面成为该领域的专家,可以是统计,也可以是机器学习或者Java编程,然后再一件接一件地慢慢尝试更多的事情”。你也需要接受别人的帮助,因为你不可能一个人解决所有的问题。此外,交际圈和沟通技巧同样也是非常重要的,所以你也需要着力于培养自己的一些包括“软实力”在内的一些技能。