每日生活裡在空氣中、在四周飛來飛去的一點一點資訊,關於一些似曾相似的人、一些聽說過的事,好似一條思緒的流水的源頭,是否偶然之間會勾起一些聯想?一站一站的聯想雖說可能有一些紊亂無條理,但每一點跟每一點間多多少少都有一些關連,也許是時間或是地點,或是人、事、物、感官的相似性,撥開一頁頁的記憶,卻也蠻像看一個故事。

用另外一個情境來想像:為了瞭查資料從維基百科開始搜尋起,讀文章過程中看到一個不太懂的詞彙就跟著超連結來到另一頁說明,或是透過「相關連結」、「參考資料」到了其他網頁,擴散資訊的接受範圍,是否也很像回憶與聯想,只是透過實體看得到的連結(link)探索知識的不同的區塊?

世界上存在著各種的資訊,熟悉的或是陌生的,而這些資訊也是相互有一些關連性的,如何將有用的資訊以某一種關連性或屬性做整理、分析、呈現,是一種藝術,一種敘事(說故事)的藝術。

Linked Data

如果說一筆接一筆的資料可以形成一個故事,那首要的問題就是:資訊是如何串連的?我們可以如何透過一則資訊找到另一則相關的資訊?或是反過來以一個資訊提供者的角度出發,我們要如何整理資訊,讓需求者可以很容易找到自己想要的東西?

在人工智慧的領域,這樣的問題可稱為一個知識表徵(Knowledge Representation)的議題,即代表知識的方式或是形式,以資訊科學的觀點切入,就是如何表現知識讓電腦或其他計算器可以容易檢索、分析並運用。我們所關心的是利用一種語言或一種型態來描述知識,建立一個本體論(Ontology)來表現一組資訊相互的關係與概念,以 OWL(Web Ontology Language)為例,我們討論如何用本體論建立資訊之間的連結。

簡單說,OWL是一個可以用來描述知識的語言。在OWL裡面主要有三個核心的元素:個體(Individual)、類別(Class)與屬性(Property),而這三個元素可以組合成表達式(Expression)用來說明某一個概念。舉例說:『「約翰」這個個體屬於「人類」這個類別』即為一個表達式。表達式可以用來描述各種類別、子類別、個體間關係或屬性等的資訊,假設我們有以下三個表達式:

  • 「男人」是「人類」的子集(Subclass)
  • 「鳥類」與「人類」是(Disjoint)
  • 「約翰」屬於「男人」

從這三個表達式,雖然沒有其他表達式,但我們可以推測幾件事實:首先約翰屬於人類,因為男人是人類的子集,因此只要屬於「男人」這類別的個體同事也會屬於「人類」;再來,我們也可以推測所有屬於「男人」的個體必不屬於「鳥類」,由於人類與鳥類兩類別相斥,因此可以推測屬於男人的個體既然也必屬於人類,就不會是鳥類;最後,由上一層的推測,我們也可以得知約翰不是鳥類。

當然,這是一個很單純的例子,也說不上什麼故事性,但是當表達式越來越多,從表達式中所可以推測出的資訊就會越來越充足,逐漸的,我們也就可以從這些表達式中,找到一些敘事的脈絡。

另一個值得一提的是語意網(Semantic Web)的相關技術,其與資訊的串連有十分密切的關係,利用RDF、XML等標註,搭配像OWL的本體論,語意網建立了網頁相互連結,以及可被分析的基礎,也是一個與資料串連息息相關的技術。

資料中的故事:過去案例分析

資訊的傳遞透過人、透過各種傳播媒體,但是要讓資訊引起人的注意,以加強散播的速度,其中一個關鍵在於這筆資訊有沒有經過有系統的整理?是否關乎我們在乎的議題?是否有一個故事?在資訊科技的發展之下,利用經過串連的資訊我們也許可以尋找出一個整理、個人化篩選並以有趣味的方式呈現故事的方式。

很早用到資料串連形式來呈現的敘事是超連結敘事(Hypertext Narrative),有一點像是小時候看的多種可能性故事會出現「如果你要打開門請翻到第10頁,不然請翻到...」,在欣賞超連結故事時,讀者可以在邊讀的過程中,點選不同的超連結,就會跳到故事的另一頁面接續,像在探索一個網絡的各種可能性,這種超連結敘事雖然簡單,但已經觸及本篇關於資訊連結的一個核心問題:資訊如何連結?資訊為何要連結?。

一個非常實用的例子就是將敘事應用在數位典藏與數位導覽。博物館中幾百、幾千件展品該如何有系統地擺放,並針對每一個參觀者做客製化的導覽,不論喜歡看哪個時代、地域、材質等等的展品,可以安排一條路線,並且有條理深入淺出地介紹,以符合每個人的參觀口味。目前有一個有趣的專案叫做Storyscope其概念就是希望用敘事與故事的方式增進一般大眾對文化遺產的探索,並從中找到一些規則與有趣的議題,他們用資料夾(Dossiers)的概念將協助研究者蒐集一個展品所有相關的資訊,把它編在一起,以形成每個展品專門的敘事資料夾。

當然,當資訊與多媒體素材都已整理為一個本體或是在資料庫李,不需要實體的展品,利用人工智慧技術抽取有用資訊就可以自成一個敘事。ARTEQUAKT這個作品就是利用使用者提供的個人興趣對名人資料進行特徵篩選,產生一個符合使用者興趣的生平簡介。

近年來開始使用本體論作為故事的知識範疇的研究也相當多,其中一個有趣的提議就是將講故事的單位(fabula)定義為一個本體論中的表達式,一個敘事就是一群有主題性、目標性的表達式組合,而關於這些表達式如何組合、架構,便是最大的學問之一。最容易的方式即為用模版,將事先設計好敘事架構並留空間填入關鍵字句,這種方法雖說架構上容易[4]。另一方式倒是可以效仿許多故事產生的方式,把本體論視為一個網絡搜尋的問題,根據特定的特徵值篩選網絡,選出一條最符合要求的架構,再搭配適當的表現方式。

不論用何種方式產生故事或是應用於何種情境,值得注意的是目前資訊供給正朝著一個具故事性的方向做整理與表達,賦予原本零散、較無關係的一些訊息流暢度,是現在知識呈現一個共通的特色與許多研究持續探索的議題。

結論與展望

資訊經過串連以及處理過後變成敘事,這一件事情是跨資料檢索、人工智慧、自然語言以及個內容學門的一大學問,無法用單一解答或是方式去解決,別論語言處理的複雜度與敘事本身的抽象,各領域的人說故事的方式,說歷史故事的與解說自然生態便是截然不同,因此也無法用單一資料分析方法或是固定呈現模式來概括所有領域的知識。

但資訊串連與故事產生議題的結合,不論應用在何領域,會持續存在與發展的,因為敘事可以帶來趣味、引來注意,可以位原本眾人可能不在乎的資訊帶來生命力並引來關注,更在教育、文創、藝文創作上有其價值。

故事永遠說不完的,但這也是這個議題最耐人尋味的一面!

參考資料

[1]: Joost Geurts, Stefano Bocconi, Jacco van Ossenbruggen, Lynda Hardman "Towards Ontology-driven Discourse: From Semantic Graphs to Multimedia Presentations"

[2]: Dov Winer "Review of Ontology Based Storytelling Devices"

[3]: Jill Walker "Piecing together and tearing apart: finding the story in afternoon"

[4]: Mischa M Tuffield, David E Millard, Nigel R Shadbolt "Ontological Approaches to Modeling Narrative"