第二天 大家都很友善

Sunday, May 21, 2006
第二天是開始正式見習拉~~~~其實仍舊是抱著忐忑的心情來面對,但相較第一次碰面,心情放鬆了些



潔菁組長幫我安排了一整天客服系統組行程,早上是兩小時客服窗口的對談,下午前兩個小時是"文章專卷"與"圖片專題"議題,後兩個小時是數位化流程的介紹,還跑到聯合報系二大樓看了OCR後的校對現場



早上10:00



兩位客服負責人,他們同樣都是十年以上資歷的聯合報系員工,算是老資歷的聯合報人了,曾小姐負責對外的客服窗口,要處理網站留言/E-mail/客服電話,從他累積多年來的faq,體會倒對外客服窗口的問題複雜度,幾百條的常見問題的制式回答範本,分門別類,只要遇到一樣的問題就copy/paste拉,這樣一來可以讓服務標準化,也便於他人交接或是臨時職務代理,經驗告訴我們"會看授權條款與規定的user是稀有動物",所以就算很多問題網站上已經有解答了,例如為何要扣點,為何要收你一年600圓,為何一個月以前的資料要記價使用...等等,但仍有白目的user會透過各種聯絡管道(電話/E-mail/留言版)反應,因此客服專線真的不是像我這種EQ太低的人負責,我一定會被愚笨的問題給氣的火冒三丈,然後在電話中對著User咆哮.... 然後飯碗就不見了... 總之很佩服客服大姐的耐心與毅力



客服窗口其他的工作還包括了處理訂單,寄送贈品,針對每天的報紙把錯字從資料庫中改正,但當天改正後的資料並不會馬上能夠從知識庫中查詢到,得等到隔天凌晨的資料庫"重建索引"後才可被查詢,另外還有接到圖庫訂單時從資料庫中找出原始檔,如果圖庫找不到,便需要跟原攝影記者聯繫取得原始檔,順便加入圖庫中



還看到了ICW內部查詢資料庫,由於"圖表"與"外電"不能透過知識庫存取,但為了服務報社內查詢需求,內部查詢ICW有四個類別 1.分頁影像 2.外電 3.表格 4.新聞全文(?)



聊到圖庫購買的部分,我發現聯合的圖庫跟知識庫是兩個不同的資料庫系統,其實應該獨立成兩個對外網站窗口,但目前仍以知識庫為統一窗口,要進去圖庫網之前還得從知識庫的頁面才能進入,但圖庫應該是很賺錢的一塊,以我的觀察,聯合經把每天記者到處拍回來的照片都丟進資料庫了,無論有沒有見報,每天都有成千上百張的照片被"倒"入圖片資料庫中,經過圖說註解->分類->專題化後,假如我今天是某某名人要出書,我大概也得跟聯合報談價錢"買回自己的照片"吧! 看來攝影記者每按一次快門,就可以增加圖庫的資料數量,未來這些從1990年開始累積進三百萬張的照片,將是很大一塊收入來源吧(我的猜測),聽說賣的最多的還是影視明星的照片... (唉)



照片定價方面似乎都有談的空間,而且令我驚訝的是,每賣出一張照片,該照片的攝影記者便可分紅,雖然分紅的數字不多,但這也是鼓勵記者努力按快門的誘因機制,翻滾吧!男孩!

聯合影像圖庫 http://udndata.com/image/

圖片轉載授權 http://cs.udndata.com/public/authority.html

(ps.目前"圖片專題"最熱門的是"企業人物",目前共有30個專題,數量最多的是"大陸旅遊",有197個分類,舉凡長銷的題材如民俗節慶,藝術表演,台灣風光等可以深化在地文化涵養的題材,卻敬陪末座,這個我可要改天好好問清楚...)



中午



跟客服系統組為主的同仁們一起享受35圓還送泰式奶茶的涼麵,拖欣怡的福我們還有好吃的水餃,午休就在歡笑與八卦中度過了



PM 2:00



施小姐是報系退休人員,退休後回聘在知識庫工作,負責"新聞專卷"與"圖片專題",他應該是最熟悉條件查詢策略的人,因為目前的專卷/專題都是他負責人工過濾產生,所以如何在幾十年的資料海中撈出有用的一小部分,得靠著對新聞事件了解與關鍵字集合設定精準搜尋,目前兩年內產出近三百篇的文字專卷,說實在不是相當的快速,但實際上很多新聞事件是必須靠人工篩選過濾,才能得到最適切的資料範圍,三天才能產生一筆文字專卷,所以為了節省時間,以特定的系列報導或是透過版次檢索(例如醫藥版,消費版)便可以快速找到系列報導,便是現成的專卷,可縮短建立專卷的時間



從專卷的產生流程我們發現,在資料海中找到有用的題材是相當人工且辛苦,我的疑問是如果只是經由一個人的判斷來產生專卷,那相當容易受到個人偏好,影響了專卷題材的方向與取材,畢竟專卷也是透過人來精確檢索後,刪除不要或不相關的資料,讓後來的人可以不用再多花時間過濾,我建議可以從常見搜尋關鍵字來歸納出有看頭的專卷主題,從使用者的需求角度來設計專卷方向,應該會更貼近使用者吧 (不過聽說大部分人也都是用來搜尋影劇消息...唉)



圖片專題的生產流程則是會參考最近的照片授權訂單,來成為建立專題的依據,不過應該也會有懶惰又大牌user打電話還就問"我需要XXX的照片,現在可以找給我嗎?",之類的問題,看來專題或專卷的歸納,仍舊依循傳統模式,透過人工在原始資料中花時間過濾提煉,這......好像可以更科學有效率一點點.. 例如依照使用者需求排名來整理熱門專題,或是從資料相關性來找到潛在的題材,以題材重複度來歸納出高密度的議題...等等



聊到智慧查詢這件事情,施小姐提到宇匯(Bridgewell)這家公司曾經兩度接觸聯合報,但都沒有作成生意,不過到是亞利桑那的AI LAB陳教授提出的搜尋技術得到他們的重用,花了幾十萬美金(?)買下技術,成為目前智慧搜尋的核心,但這個關鍵字分析由於跑的太慢,目前只開放回溯一年的資料檢索...這.... 好歹也是一小步



施小姐把帳號給了我,讓我玩了一下專卷與專題後台系統,系統畫面與流程可以在課堂報告時demo出來



PM 4:00



曾小姐與張小姐分別交代了新聞內容數位化的流程圖,透過印務部的"人工圖文關聯",每天的日報在凌晨四點就可以在知識庫中可被查詢,接著資管組會負責拿著當天的報紙開始校對,如果有立即更正的資料,那也是隔天才會更新了



我們還跑到聯合二大樓看了OCR後的一校與二校流程,恩...真是花眼力的工作.. 我想我應該不會想碰吧...但真的是勞力密集的工作,想想聯合報系過去五十年多少的資料都要先OCR後在經過人眼校對...想到就頭皮發麻! 不過校對軟體倒是很有創意. 我拿到了流程圖, 我想課堂上又可以解釋個五分鐘吧





大體上一整天收穫很多,有些在心中的問題要在更清楚些,釐清重點後在下次重問一便.有幾個問題



1.知識庫首頁怎麼沒考慮改版阿?

2.圖庫跟知識庫既然是分開的系統,為何窗口不分開?

3.專卷的產生可以更貼近使者搜尋排行關鍵字來決定嗎

4.照片授權費用的彈性空間有多大?

5.再想想...

0 則留言: