第一次見面

Sunday, May 21, 2006

今天是我到聯合知識庫的第一天,怕遲到又晚出門的我,只花了20分鐘從木柵飆車到聯合報,還好趕上了....



"真是年輕的主管",是李彥甫給我的第一印象,跑科技新聞十年,曾屢獲李國鼎新聞獎,名校清大電機系畢業的他,捨棄了成為科技新貴的機會,反而一頭埋進新聞領域十年餘,我想我得找個機會好好請教他這個選擇,以及一路上的心路歷程



由於是第一次碰面,我下午又要回學校上課,因此我只有上午兩個小時的時間,就當作是一個熟悉彼此的開始吧!



李經理耐心的介紹目前聯合知識庫與聯合報系的關係,以及"聯合線上"未來要上市上櫃的計畫(我查了新聞,在2005年就已經有這個計畫了),預計希望最快年底,或是2007年初可以公開發行,



"聯合線上UDNNEWS online"分為兩大事業體,一是聯合新聞網(web service),二是聯合知識庫(info service),聯合知識庫的營收有三大方向



1.Data service (我想這就是指UDNDATA的訂閱服務)

2.聯合報系的內容對外授權窗口

3.數位化技術供應者



接著提到聯合知識庫的任務編組,目前有26位同仁,其中專任20名,記時制約用人員6位 (感覺上計時約用人員比例不少,除了坐櫃檯的育達學生之外,還有其他的繁瑣工作的需求嗎?)



談到人力便有繼續提組織架構 (此時感受到李經理的溫暖與體貼... 我還沒開口他就主動講了..)



共有三個任務編組,



1.客服系統組 負責web架構與系統規劃

2.資管組 在11樓負責技術工作,但機房是交給isp代管(web hosting)

3.行銷業務組 負責對外合作與技術諮詢與申請免費試用帳號窗口



李經理就跟我簡單介紹了半個小時,讓小弟不禁汗涔涔淚潸潸,人間有溫暖,夏天的冷氣,冬天的暖流,未來一片光明與希望 (抱歉我失態了)



接著把我交給田潔菁小姐,李經理便起身回去處理他的工作了,於是會客室留下我與田小姐



潔菁是我這兩週見習的保母,目前是客服系統組組長(此組對外負責網站的系統規劃與客戶服務),他同時也是筱玫老師曾在課堂上提到的學生,因此倍感親切,也好在這份遙遠的關係,我們聊起來格外開心



大致上繼續談了一個半小時,這段時間比較像是意見交流,我談談我對知識庫的想法,他除了回應之外,也更進一步談到他所負責的區塊,如果把他當作學姊來看,其實對話過程就像是聊天,他也談到以前上筱玫老師在職班網傳的心得,"很多東西在課堂中也許無法馬上提會,但是先記下來,以後就可以慢慢在工作中印証"他這麼認為,我也頗有同感



從他的口中我了解到聯合知識庫是屬於營利導向,對於新聞數位化後的資料,她們看待為"資料源",讓User可以經由資料庫檢索得到想要的資料,我把這個過程看成"原油的提煉",而資料庫技術與自然語言便可以扮演原油提煉加工的機制,如何經由良好的搜尋策略與關係比對,產生出對於user最有高度相關的資料,或是讓user可以從"相關性等級",在最短時間內找到最接近的資料,應該是聯合知識庫應該要研發的機制



我初步的構想是:如果可以找出這四五年內的搜尋Log資料,找到這些年來最高頻率搜尋的關鍵字,作一個"關鍵字排行榜",我們就可以從這個排行榜中發現哪些人事地物是大家關心的,或是大家比較經常找哪一段時間的資料,根據人工判斷來製作"專題"(目前他們稱為專卷),可以節省user在一大片不相關的新聞中找到主題性的資訊,並且節省搜尋成本



另外一個想法是根據自然語言來發展出人/事/時/地/物的關係組織圖,找到龐大資料庫中的某些資料關係性,提供圖像畫的組織脈絡關係圖,在結合超鏈結的特性,讓user不再只是看到條列式的線性搜尋結果,而是產生圖像的關係結構圖,幫助user快速了解新聞事件本身的關係架構,進而點選到每一則新聞內容,因此支離破碎的片段資料便重新產生資料間的關聯性,打破傳統媒體在篇幅與時段的限制,重新組裝出整體的面貌



第一次碰面阿里阿扎的聊了一堆想法,我期待自己第二天可以更深入的看到一些現況



李經理與田組長都很友善,在五月底搬家前還勉強擠出兩週,幫我安排兩週到各部門見習的機會,這個規格與她們的新進同仁士一樣的,而且不會把我當成一般實習學生作rutine操作,我想六月份可以在爭取進一步的實習機會吧





我準備第二天見習要問的:



1.有無關鍵字pool. 專卷的選擇規則是? 有沒有統計搜尋log整理出常用關鍵字

2.過去的舊報紙與現在每天發行的新報紙,在數位化流程有何異同,現行的數位化流程會牽動到前端(聯合新聞網/傳統報紙)的作業流程嗎?

3.內部人員的專長領域組成

4.前面提到聯合知識庫三塊營收,他的比例與實際數字

5.剛剛結束的專案資料,可否提供參考

6.詢問主管到校參座談之意願

7.網站沿革,曾經作過什麼調整,考量點?

8.一則新聞若在網站上被更改,是否保留最初版本?

9.訂戶的分析資料,所佔比例,預期的資料庫用戶大宗是誰?

10.如果user不確定新聞事件發生的時間點,仍有辦法找到該事件發生的最接近資料嗎? (例如印尼排華事件)

1 則留言:

Anonymous said...

「作一個"關鍵字排行榜",我們就可以從這個排行榜中發現哪些人事地物

是大家關心的。」

這種所謂的排行榜應該是指透過分類、分群或者時間序列的分析,讓使用

者經過幾次搜尋,就可以快速的推薦他相關的關鍵字。

另外,根據人時地事物進行分類的話,應該是個很酷的功能,自動整理出

相關新聞與關係脈絡,確實很屌。

例如今天出現愛情合約先生的緋聞,可以找到這個人發生哪些事件、發過

哪些專輯,這個旅館有哪些緋聞發生過、擴大搜尋還可以找到掛了哪些

人。緋聞的話,可以整理出最近哪些藝人發生過緋聞,擴大搜尋可以找到

哪些緋聞發生過。物的話,可以找出哪些緋聞是在車上被偷拍的,進而可

以找出藝人有哪些車...

聽起來,這樣的搜尋要收斂是要有一些條件的。



加油ㄟ~台灣搜尋的未來靠你了!柳丁開腹...