2018年5月21日 星期一

Google I/O 2018懶人包:實景導航地圖、Android P、摩斯密碼輸入法、Google Photos與TPU 3.0

by Chevelle.fu Tandee 艾莉莎

2018.05.09 03:43AM



今年的Google I/O主要的內容依舊繞不開AI,新版的數位助理大幅提升語意辨識以及回應的流暢度。重要的Google Maps也增加了利用VPS技術的實景導航功能,讓你可以直接用手機鏡頭比對街景,知道自己的所在位置。

另外在Google Photos、Gboard、Waymo等方面都有大幅更新,更別說今年的重點Android P的多種新介面與功能,來看看這次活動的總整理吧!

Google Maps實景導航不怕迷路

就算現在有了Google Maps,最常碰到的問題肯定是地圖上的圓點一直轉,你永遠不知道到底面對的是哪個方向。

然而在今年的Google I/O上,Google Maps結合VPS視覺定位技術,利用鏡頭比對資料庫中的街景資訊,讓你知道你面對的方位是哪個方向。

未來只要打開Google Maps並掃一下街景,就知道建築資訊以及你所面對的方位。



▲開啟地圖時最常發生扇形指標一直轉,你永遠不知道面對的是哪個方位。



▲透過鏡頭比對街景特徵,Google Maps未來能告訴你這是什麼建築。



▲利用AR技術,上方可以看到比對的實際街景特徵,下方則是導航資訊。

聚會清單與即時投票

除了幫助容易迷路的用戶定位之外,Google Maps還新增了清單功能,可以讓你選擇多家餐廳並丟到群組中,群組用戶能對這些清單內容即時投票,這下聚會就方便多了,不再為了選餐廳而猶豫不決。

說到餐廳,Google認為除了你主動查詢地圖資訊外,你也可能會了解附近新增了什麼餐廳、有些什麼相近的資訊,因此在新版App中會推送相近資訊,讓你查詢咖啡廳的時候,也能收到風格相近咖啡廳的內容。

此外,新的地圖中也逐步增加了機車導航功能,這大概是多數台灣通勤族最想要的功能了。


▲還能建立清單,聚餐就方便多了。


▲建立完清單可以立刻投票。



▲對了!Google也正在推機車版導航喔!

Android P利用AI更省電、更聰明貼心

今年適逢 Google 自 2008 年 9 月正式公布 Android 1.0 的十周年,也在 Google IO 大會公布暫未還有甜點名的 Android P 新功能,這也是一次相當大幅度的版本升級,除了將藉由 AI 提供更智慧、個人化的能力,同時操作介面也會全面翻新,並且加入全新的 Dashboard 功能,可做為自我使用習慣的監控,甚至還可設定特定 app 一天可使用的時間,做為自我管理避免沉迷網路之用。

Android P 預計在今日釋出 Beta Program ,除了Pixel 、 Pixel XL 、 Pixel 2 、 Pixel 2 XL 等 Google 自家裝置外,同時包括 Nokia 、 Vivo 、 One Plus 小米、 Sony 、Essential 與 Oppo 也將有可相容的機種,目前包括 Essential Phone 、Nokia 7 plus 、 Oppo R15 Pro 、Sony Xperia XZ2 、Vivo X21UD 、Vivo X21、 Xiaomi Mi Mix 2S 等裝置都可進行刷機,但還是老話一句,目前還是開發者測試預覽版本,勢必多少會遇到問題,若作為主要使用手機不建議申請並刷機避免遇到狀況。

申請 Android P Beta Program 可到官方網站:請點此



▲Android P 此次的第一項重點是透過人工智慧帶來更好的使用體驗,此次首項新機能是 Adaptive Battery ,其原理是透過 AI 學習使用者習慣,並用於電力管理,號稱可省下達 30% 的 app 啟動時的 CPU 電力。



▲其次是基於 AI 的螢幕亮度管理 Adaptive Brightness ,基本上就是將已經有許多手機晶片商提供的螢幕自動亮度管理方案整合進系統原生機能。



▲新的Slices介面,讓你搜尋時有更多的變化,像是直接開啟App或是提供更多元的資訊。



▲最後是 App Actions ,同樣也是分析使用者習慣,分析並建議使用者接下來可使用的 app ,例如拿起手機的瞬間,會提醒是否撥打電話或是要外出,戴上耳機後則開始依照常聽的音樂推薦使用 Spotify 並播放音樂,在搜尋列搜尋復仇者聯盟,還會出現附近上映的戲院、訂票,搜尋叫車軟體,則還會出現直接將目的地定位到公司或是家中的建議。



▲此外,為了開發者更容易導入 AI 功能, Google 也偷渡了 ML Kit 的 SDK 介紹,這項 SDK 適用於 Android 與 iOS ,能夠將 Google 預先培訓的模型快速導入開發者的 app 中,能夠作為影像分類、文字分析、臉部偵測、條碼掃描、地標辨識與智慧回覆等,這些模型將可離線與連線使用,提供基本或是進階的 AI 功能,此外針對有更進一步需求的軟體開發者, ML Kit 也支援 TensorFlow Lite 。

Android P操作用手勢取代虛擬鍵

此外, Android P 的使用者介面與邏輯也將有重大的變化,有些類似 iPhone X 的使用邏輯,首先桌面上的虛擬三鍵將成為歷史,改以手勢取代,並且預設於上方的 Google 搜尋列將移到底部;未來標準的 Android P 輕點導航 Bar 將回到主畫面,長按則是啟動 Google Assistant ,將透過由下往上滑動一半進入多工預覽模式,由下往上滑到底則是進入 app 列表,至於在導航 Bar 往右滑動可切換先前使用過的 app ,返回按鍵僅在進入 app 中才會出現。



▲新的介面中可以直接在Tab下選取特定文字。



▲另外過往會出現在上方並以橫向操作的音量控制,在 Android P 將改為直向的上下調整,更符合單手握持的自然操作習慣;且此次在手機轉為橫向時,不再需要由上方拉下下拉選單選擇轉向,導航 Bar 將顯示轉向按鈕,可一鍵旋轉。

可統計使用行為的Dashboard

另外 Android P 也加入稱為 Dashboard 的使用習慣統計功能,能夠偵測並分析使用者一日的使用行為,包括 app 使用時間,接收多少通知,以及呈現統計圖表,當使用者為了避免沉迷在特定 app 上並想有限度使用,甚至可在 Dashboard 設定使用時間限制,當超量時也會提出因應的警告。

另外勿擾模式也更為強化,開啟之後將會完全暫停除了設為重要聯絡人以外的通知,全新的 Wind Down 功能允許使用者設定就寢時間,當時間一定會自動進入勿擾模式,並將手機轉為灰階,不過功能將正常,只是作為一種提醒,現在當把手機放在桌面並朝上時,當手機跳出通知,將手機翻至背面就可自動進入勿擾。



▲Dashboard會顯示App的使用資訊。



▲滿實用的勿擾功能。



▲手機翻過來就會自動靜音。

讓老照片重生的Google Photos

Google Photos 在陸續加入許多基於 AI 的技術後,現在已經不僅只是網路相簿,能夠自動幫使用者以照片特徵進行分類,也能協助使用者將照片變得更動人,而在 IO 大會, Google 宣布 Google Photo 將在未來一兩個月的新版本加入更多基於 AI 的自動後製建議功能,檢視照片時只要輕輕一點,就能進行諸如對比調整、人像照片的背景黑白化,或是拍攝文件時自動進行梯形校正並建議儲存成 PDF 檔案等,其中最驚豔的是將加入黑白照片彩色化的功能,這項技術將有助於使老照片變得更鮮明。



▲此項技術也是透過學習相同照片的黑白與彩色版本作為基礎建構模型,並利用分析黑白照片中的特徵進行上色,雖然顏色不可能 100% 準確,但至少能將黑白照片變成合理的彩色照片,不再需要透過人工上色方式進行黑白照片的彩色化。當然也能反轉操左,把彩色照片做黑白處理,並保留重點部分的色彩。

請數位助理幫你訂星巴克

隨著AI與文本的數量增加,現在Google數位助理能做到的事情越來越豐富,語音能操作的範圍也越來越廣泛,今年也有多家如LG、Lenovo等投入相關硬體的製作。

除了可以更加人性化地辨識、回應你的語意外,功能性方面也可以透過數位助理調整家中的智慧裝置,像是冷暖氣的溫度,甚至能透過數位助理幫你跟星巴克訂杯咖啡。

未來Google Maps也將內建Google數位助理,提供更強大的語音控制。此外,透過AI數位助理還能幫你打電話訂餐廳外,還能跟真人對談,且能應付真人的各種特殊狀況,像是重複確認、沒位子、改期改人數等問題。



▲透過數位助理現在還能操控家中其他的智慧裝置,像是調整家中冷暖氣的溫度。



▲除了本身的服務外,數位助理也能幫你訂個星巴克。



▲你對數位助理下複雜的訂位指令,它也能辨識出其中的語意,特定地點、模糊的時間,AI都能辨識並分析其中的意義。

身障者透過摩斯密碼輸入 重新與社會連結

Google開放摩斯密碼輸入法,重度身障者可透過摩斯密碼輸入文字,再透過Google小姐的語音功能,讓身障者彷彿找到自己的聲音。

同時讓身障者不再與社會脫節,可不假他人之手上網搜尋資料、輸入資料甚至可以發送Email等。

Google影片當中請到的Tania是名身障者,不但行動不便就連正常發音都有困難,雖然市面上協助身障者溝通的的溝通板眾多,但是大部分只能面對面使用才能讓對方瞭解身障者想表達的內容。

但透過摩斯密碼輸入法,就能輕鬆把想表達的內容輸入到電腦中,透過Google小姐語音發音,就猶如Tania親自在敘述一般。



▲一般常見的溝通板會把字母、常用的單字以及需求放在同一個板子上。

影片中的Tania是透過頭部觸控感應器,感應器可分辨摩斯密碼的長、短,Google接受到摩斯密碼輸入法之後,就能完成一段文字,同時也可以透過Google小姐協助發音。

而Google的摩斯密碼輸入法甚至可以直接把文字輸入到電腦裡,因此像是查資料、輸入文件、發送Email等,都不需要再透過他人協助,只需要透過Google就能完成。某種程度上不僅是幫助Tania溝通,還能透過Google跟社會重新再連結上。

如此一來,即便是中文,也可以使用羅馬拼音再透過摩斯密碼發送訊息,也許有機會透過觸控螢幕就能輸入摩斯密碼,這對於手部功能還正常的身障者來說,算是相當便利。



▲Tania透過頭部感測器可以分辨摩斯密碼的長或短。



▲摩斯密碼只是一個輸入法,透過感測器再傳送到Google。

TPU 3.0效能是先前的8倍

Google 在今年 IO 大會的主軸繼續圍繞在 AI 應用層面,然而作為 AI 背後仍需要深度學習的伺服器作為基礎,先前 Google 已經針對其語法 TensorFlow 推出專屬加速架構 TPU ,而今年 IO 宣布最新的版本 TPU 3.0 ,性能宣稱達 100PFLOPS ,為 TPU 2.0 的八倍,但也因為倍增的性能, TPU 3.0 已經無法以風冷抑制發熱,需動用水冷作為冷卻機制。



▲目前 Google 並未針對 TPU 3.0 做更進一步說明,不過截至 TPU 2.0 , TPU 仍須搭配 CPU 與 GPU 混合使用,同時以現階段深度學習框架而言, TPU 扮演的是針對 TensorFlow 的加速部分,但在整個深度學習過程還需要其它的運算,應該還無法以單一硬體加速實現從學習到推理的部分。

在惡劣環境下行駛的Waymo自駕車

Waymo自駕車不但可判斷目前正在高速行駛的車輛,同時還可預測此輛高速行駛的車輛是否將會闖紅燈以及行徑路線。

經過600萬英里的測驗,在下雪中的險惡環境也能感測路旁車輛或其他障礙物。

Google Waymo自駕車表示在技術上又更精進了,不但可以知道目前行駛的路況,還能模擬道路上其他駕駛者的行駛狀況,因此可以預測有可能發生的突發狀況。

這次以闖紅燈來舉例,Waymo可以偵測到高速車遇到紅燈未減速,且預測此高速車將有可能闖紅燈,因此Waymo在偵測高速車的速度以及距離,在碰撞前就先做好安全煞車。

Waymo除了上述應變以外,還強調Waymo可以在惡劣的環境下做精準的判斷,這次以雪地環境來做說明,在下雪中且已有積雪的環境下,Waymo仍能精準感測道路旁的障礙物。

未來也將會安排預約叫車模式,目前規劃將會比照Uber的預約模式進行。



▲往前行駛時,可以偵測到右方高速行駛的車輛,同時預測該車輛即將闖紅燈,並預測其行駛路線,在碰撞前就Waymo先安全煞車。



▲在下雪且已有積雪的道路上,仍可以清楚偵測到周邊環境狀況。

沒有留言: