返回

造像者

首頁
    生興奮感和一些超常舉動。

    我們也希望這個小東西能夠給沉悶已久的學界帶來一些新鮮刺激。

     主持人:說得太好了宋教授,那麼能否請您用比較淺顯易懂的語言向觀衆們介紹一下這套系統的工作原理呢。

     宋教授:有點難,我試試吧。

    大家知道,人工智能發展其中一個重要方向就是讓機器模拟人類大腦的思考過程,而最關鍵的第一步就是讓機器學會像人一樣接受信息。

    人類有非常複雜的感官系統,但信息最主要的輸入方式還是視覺,這就涉及兩大領域的識别:文字和圖像。

    目前在淺層感知領域,語音識别、文本分詞、人臉識别等已經比較成熟了,但從淺層感知到特定語義組合的映射,比如從動作姿态來分辨一張全家福中不同成員之間的關系,對一首詩歌裡的情感指向進行分類,目前還隻能在限定領域通過大量訓練來實現過得去的效果。

    至于像人類那樣複雜的認知能力,機器其實還處于非常早期的階段,大家可以看這張圖。

     (屏幕上出現4乘4的圖片矩陣,每張圖都是關于貓的,在不同環境下、從不同角度拍攝的不同種類的貓。

    ) 宋教授:啊,這是我女兒挑的照片。

    對于人類來說,即便是一個小孩,隻要他見過貓,不管是大貓小貓,黑貓白貓,貓頭貓尾,他都能夠分辨出來。

    但對于機器則不是這樣。

     (16張圖中的13張都被打上紅叉,隻剩下3張貓咪頭部正面特寫,萌态可掬。

    ) 宋教授:之前我們做的機器圖像識别,無法像人一樣從事物的不同狀态中提取出某種底層不變性。

    抱歉我又要拿貓舉例子,一隻貓胖了瘦了,掉毛了生病了,或者給它穿戴上各種裝飾品,它打個呵欠、發怒、舔舌頭,它都是同一隻貓。

    而對于機器來說,圖像的尺寸、背景、光照、位移、旋轉、畸變、遮擋……都會影響它的判斷,它隻能根據既定算法進行有限層級的映射,而無法模仿人腦通過多層神經網絡進行分層遞階的多粒度計算…… 主持人:抱歉打斷您一下,這部分内容或許對于欠缺背景知識的我們來說有點難以理解,那麼您發明的CATNIP系統是如何解決這個問題的呢? 宋教授面露尴尬:不好意思一不小心就說多了。

    确切地說,我們的一隻腳才剛剛跨過門檻,離真正解決問題還早着呢,這個系統也隻是整個大計劃中的一個前驅項目。

    我們的靈感其實來自語義分析,大家知道,信息的意義其實并不在于信息本身,而存在于其結構中,就像文本意義存在于上下文,圖像的意義存在于時空結構之中。

    我們能否通過索引對象存在于整個時空結構中的信息來幫助機器識别對象,這是整個項目靈感的源起。

     主持人:我問一個外行話,如果機器都無法準确識别對象,怎麼能去尋找它存在于,嗯,所謂時空結構中的信息呢? 宋教授:你這個問題提得非常好。

    就像照片裡的小貓,你是先知道什麼是貓,再去找貓在哪兒,還是先知道貓在哪兒,再去識别什麼是貓?這就是一個“雞生蛋蛋生雞”的悖論。

    目前我們的神經科學和生理學知識尚無法解釋人類的認知過程是如何發生的,更不用說教會機器了。

    于是我們采用了另一種思路。

     主持人:這聽起來就像是推理小說啊。

     宋教授:呵呵,這個比喻有意思。

    我們是這麼做的,從語義上給定一個對象,通過對接外部數據庫去抓取相關的信息,包括語義和圖像,并按時間序列構建起意義連續體,然後我們把真實的對象擺到機器面前,比如說,一隻貓,機器會在捕捉到的動态畫面與意義連續體之間尋找可能的流形映射,當它确定兩者之間能夠建立映射時,也就是說它“認出”這隻貓時,就會“咔嚓”一下,按下快門。

    當然這隻是個簡化的比喻,背後有許多艱深的算法,我們希望以這種倒推方式找到提升機器識别能力的辦法,它更多的是一個數學上的問題。

     主持人:聽起來蠻有意思的,那怎麼會想到把這項技術從實驗室裡帶到CCES呢? 宋教授:嗯,這個我不确定能不能說,之後我跟領導确認一下,如果不方便公布你們就剪掉吧。

     主持人:沒問題。

     宋教授:其實這個項目除了來自國家的專項基金外,還有幾家大科技公司的資助,他們希望能從前期介入,看看這項技術商業化的前景如何,另外一點,我們需要更多的樣本幫助機器進行深度學習,而真實環境中的對象遠遠比實驗室裡的模拟條件來得複雜。

    正好我的組裡有一個狂熱的攝影愛好者,他幫忙設計了這個,被我們認為“錦上添花”的照相模塊,包括調焦、光圈、快門以及濾鏡庫的調用等功能。

     主持人:這會不會涉及到數據隐私的問題? 宋教授:所以我們采取了邀請制,所有對象都必須經過資格篩選,并簽署具有法律效力的協議書。

     主持人:之前網上讨論得非常火熱的是,一些受邀請的用戶曬出了CATNIP給自己拍攝的照片,并分享了他們的感受,其中有人說,這些由機器拍出的照片“比真人拍攝更有感情”,甚至能夠“觸動心靈深處”。

    對此您有何評論? 宋教授:這個,我隻能說,機器所有的行為都是受程序及算法控制,它是camera而不是cameraman,那種能夠産生情感的機器隻存在于科幻電影裡。

     主持人:您自己用CATNIP拍過照片嗎? 宋教授:我自己沒有,不過……我替我家人拍過。

     主持人:
上一頁 章節目錄 下一頁
推薦內容