方便好用的Excel反而增加遗传学家的挑战

Excel会自动重新格式化数据

Microsoft Excel居然是遗传学家的一大难题!人类基因有 23 对染色体,包含约 30 亿个 DNA 硷基对,部分硷基对组成了大约20000 到 25000 个基因。在科学研究中,学者需要为每个基因起一个特定的名称以便快速定位,这些名称一般由字母加数字的形式组成。

不过因为Microsoft Excel该程序会自动重新格式化数据,并完全打乱数据内容,相信各位都有使用过微软推出的文书软件Office,而Microsoft Excel是所有文书软体当中最多人使用的软件之一,微软 CEO Satya Nadella在Aspen Ideas Festival论坛上表示,微软历来最重要的发明,并不是 Windows、并不是 XBOX,而是 Office 中的Excel,Excel是微软带给世界的伟大创作,令全球企业的办公效率大幅提升,对「数字」有更深入的了解。

一年内改变了27个人类基因的名字

不过对于遗传学家,这是一个十分令人惊讶的问题,甚至会对已发表的研究产生严重影响。Verge报导表示由于微软不会专门为遗传学家而更新它们的软件,导致科学家们只能在大约一年的时间里改变了27个人类基因的名字,且在近几日发布了新的命名指南。

Excel在自动重新格式化数据方面尤为积极,由于这些错误需要被进行研究的科学家修正两次,且会在Excel自动格式化触发那边再修正一次,因此有些错误会大大地被遗漏。

我们也推荐 科学家利用乌贼的基因赋予人类细胞隐形的能力

3597篇遗传学论文中约有20%的Excel错误

根据科技期刊《基因生物学》(Genome Biology) 2016年的一项研究,3597篇遗传学论文中约有20%的Excel错误。

Quadrams研究所的生物学家告诉the Verge「这件事是真的很麻烦,导致有许多研究都得因为命名方式来重新整理,非常讨厌,且Excel是一种广泛使用的工具,如果对计算有点笨拙的人都会使用到它,在我读博士的时候,我也这样做过!」

不过现在有了新的指导方针,科学家应该希望能够避免任何可能使Excel混乱的新基因名称,例如MARCH1现在是MARCHF1、SEPT1现在是SEPTIN1。

Excel的发明让数学不好或是有计算障碍的人们拥有许多方便,像是试算表软体的基本特徵是储存格内可输入资料、公式、函数,每一个储存格都可以作为其他储存格的输入,它提供了一个友善、透明、易用的分析工具。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

相关文章