《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 業界動態 > 能夠識別基因突變,谷歌AI工具這么厲害?

能夠識別基因突變,谷歌AI工具這么厲害?

2017-12-11
關鍵詞: 軟件 谷歌 DNA

  如果你曾經看過《犯罪現場》這樣的罪案劇,你可能會想起一個場景:法醫通過電腦對數千個DNA片段進行搜索,從而匹配出犯罪現場和犯罪嫌疑人。雖然這個過程在現實生活并不像電視劇那樣,但是主要思路是一樣的。遺傳學本質上是一門比較科學。無論你是想確認一名嫌疑犯、一種基因疾病還是一名失散已久的親屬,都需要將一個基因組與另一個基因組進行比較,從而在數十億個DNA中發現相似和不同。

  雖然確認失蹤人員或者犯罪嫌疑人的過程通常只會涉及到一個人的幾個遺傳片段,但是像識別某種疾病的基因變異這樣的問題,往往需要大量的數據處理。盡管目前很多前沿的研究都是為了幫助科學家們做到這一點,但對所有這些數據都做到充分的定義還面臨著巨大的挑戰。這也正是人工智能所要解決的問題。

  本周,谷歌推出了一款名為DeepVariant的程序,可以通過深度學習來拼湊一個人的基因組并且更準確地識別出DNA序列中的突變。

  這個技術在谷歌中曾經用來識別一張照片是貓還是狗,在這里DeepVarient利用了相同的技術解決了DNA分析領域的一個重要問題。現代DNA測序儀可以執行高通量測序,讀取出的不是完整的DNA序列,而是重疊的短片段。然后將這些片段與另一個基因組進行比較,從而將它們拼湊在一起,進行變異識別。但是這項技術很容易出錯,科學家也很難排查出這些錯誤以及小突變。這些小突變非常重要。它們可以提供重要的見解,比如說,疾病的根本原因。區分哪些堿基對是錯誤的,哪些是正確的,這被稱為“變量調用”。

  其實已經有一些工具可以幫助科學家做到這一點。最廣泛使用的是GATK,這是一種人工設計的算法,可以將統計數據應用到測序機器最常出錯的地方。然而,DeepVariant利用神經網絡技術來構建比以往任何技術都更精確的程序。去年,這項技術在FDA大賽中獲得了第一名。

  神經網絡之所以如此命名,是因為它們的工作方式有點類似于神經元在大腦中的方式。每一層網絡都逐級處理著更為復雜的工作。為了利用圖像識別技術來建立一個精確的DNA序列,谷歌團隊將DNA測序數據轉化為了一個圖像。例如,構成遺傳密碼的As、Ts、c和Gs,就會以紅色的形式出現。研究人員隨后對數百萬份基因組測序和高通量讀取技術進行了研究,并教會了這個程序哪些東西更重要,哪些可以忽略。

  由此產生的算法可以比以往任何系統都更準確地對錯誤進行排查。最初,這些圖像僅由三種顏色組成,或三層數據。不過,本周發布的最新版本包含了7種,使其可以更加精確地表達。這個程序目前是作為開源軟件發布的,外部研究人員可以使用以及繼續進行程序強化。

  DeepVariant絕不是100%準確的。但它的成功代表了機器學習對基因學的影響。基因組數據的規模和復雜性是巨大的。機器可能正是我們需要弄明白的東西。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 韩国无遮挡吃奶床戏| аⅴ中文在线天堂| 欧美重口另类在线播放二区| 国产一区二区三区在线免费观看| **aa级毛片午夜在线播放| 幻女free性zozo交| 久久精品国产99久久久古代| 毛片a级毛片免费观看品善网| 好男人www社区| 久久精品人人做人人爽电影蜜月| 污污网站在线播放| 午夜老司机在线观看免费| 高h视频免费观看| 国产精品国产三级国产AV′| www.亚洲成在线| 新婚张燕被两个局长| 乱人伦人妻中文字幕| 永久免费视频v片www| 再深点灬舒服灬太大了岳| 观看国产色欲色欲色欲www| 国产精华av午夜在线观看| 99精品在线观看视频| 成人免费在线观看网站| 久久国产精品二国产精品| 欧美伊香蕉久久综合类网站| 国产a级一级久久毛片| 亚洲天堂2016| 成年人黄色大片大全| 亚洲AV午夜成人片| 欧美重口绿帽video| 免费看h片的网站| 色偷偷女男人的天堂亚洲网| 国产成人精品视频一区二区不卡| 91精品欧美激情在线播放| 日本换爱交换乱理伦片| 亚洲国产精品久久丫| 爽爽影院在线看| 国产区在线视频| 男女同房猛烈无遮挡动态图| 成人片黄网站a毛片免费| 亚洲宅男天堂a在线|