討論大數據法律關係的前提,必須先對資訊與數據加以定位。資訊(information)是指通知、被表達(expressed)或傳達(conveyed)或透過一般觀察產生(common observation)的資訊(message)之內容(content)。數據(data)是數位化資訊(digital information)。依照國際標準化組織(the International Organization of Standardization, ISO)第2382號標準[8],將標準定義為格式化的資訊(information)以適於溝通(communication)、詮釋(interpretation)與處理(processing)。所謂資訊處理包括人為或自動化機械處理。資訊和數據,這二個名詞,雖然國際標準部不同的內涵,但是在一般性文章這兩個詞語經常性混用,都是一種表達與溝通內容,不同於不動產與動產有形資產,權利範圍有一定範圍,無法定義其界限。資訊與數據與有形資產財產權內容亦不相容,因此包括所有權權能、占有觀念之適用有其困難。況且,數位資訊產生係因對於IT投資,而不像智慧財產權為人類心智活動,因此與智慧財產權理論亦有些為區別。那麼資訊或數據本身是否是一種財產權?是否或可以用智慧財產權保護?值得檢討。各國對於數據或資訊保護,有不同做法。英國在1979年刑法,立法說明提到資訊並非財產,因此對於秘密資訊「無體財產」提告,因為資訊不是被偷竊的物件[9]。在美國,單純事實或新聞的資訊非智慧財產權保護標的[10],但資訊本身如果符合著作權保護要件、或營業秘密保護要件,則可以著作權或營業秘密保護。國際智慧財產權公約,對於公開資料保護並未有相關規定,雖然1996年3月11日歐洲議會及理事會通過編號96/9/EC「歐聯資料庫法律保護指令」,要求所有歐聯會員國於1998年1月1日前必須於內國法令內落實資料庫指令之條款,然而並非資料本身提供保護,且僅適用於歐盟會員國。
由於既有的有體財產權架構,與現行資訊保護內含並不相容,一般探討數據或資訊保護與使用人之相關之權利與義務,仍然透過智慧財產權架構、授權合約條款與行政法管制3個面向進行檢討。2014年英國有學者將企業資料法律管控架構分為六個層面[11],為分析資料提供法律管理法規,對於數據保護概念形成,具有實義,此六層關係,分別為:第六層:資訊管理與資訊安全管理架構:設定政策、策略,適用的標準包括: PCI DSS, ISO 27001/2, SSAE 16, ISAE 3402。第五層:管制法規,包括個資法的遵循、競爭法對於資料相關規定遵循。第四層:資料有關之合約。第三層:智慧財產權法,包括資料相關之專利、商標、著作權、營業秘密。第二層:資料架構、資料結構、設計架構等。第一層:基礎設施平臺。
另外,資料庫保護與數據、或資料處理軟體之保護,均與資料或數據有關,但保護程度不同。例如:資料處理軟體是著作權保護標的,但著作權保護資料的表現形式而非資料本身。而資料庫在歐盟,倘符合「歐聯資料庫法律保護指令」即受保護。在2012年歐洲法院(ECJ)審理英國高等法院(UK high Court)Football Dataco Ltd v. Brittens Pools Ltd/Yahoo UK Ltd乙案[12],ECJ認為「歐聯資料庫法律保護指令」立法背後的政策目標是為刺激和保護「資料儲存和處理系統」,並非保護資料庫中所收集的材料或建立的材料。 因此,因此在資料庫中的資料,僅有資料的選擇或安排才受到資料保護。
大數據、資料探勘與合理使用
大數據(Big Data)指大量數聚集(data set),資料探勘(data mining)則是在探討用以解析大數據的方法,也就是透過大資料集查尋找與資料相關資訊的活動[13]。因此,資料探勘與大數據雖然指兩件事,但是彼此相關。研究人員透過大規模的計算分析相關研究資料(big data),可以分析研究結果的模式,此稱為資料探勘(Text Data Mining),資料探勘的技術為研究人員節省大量資料時間。所以,大數據分析需要透過資料探勘的分析過程,才能呈現大數據的價值與意義,而加以應用。
資料探勘過程依照資料分析的方式與所呈現的結果,必須視個案利用情況,因此未必構成重製。例如,在資料探勘的過程中,如果所使用的分析資料僅是暫時性重製,且所產生的分析結果亦僅有文獻中的內容的事實而不涉及資料的表現,則資料探勘過程並無著作權問題。因為,有關重製權的侵害,必須產生「超過短暫持續時間的期間」(period of more than a transitory duration.)之副本,如果僅是持續很短時間的臨時副本(temporal copy)[14],不屬於著作權法重製的範圍。
然而,資料探勘過程中,如果利用方式,會保留文章的永久性副本以作為驗證其分析結果之參考資料,此時因為涉及永久性副本之重製,將可能涉及著作權重製權之侵害。許多情況,資料探勘的輸出也可能涉及著作權侵害,例如分析結果呈現原始圖像,此時涉及著作權重製。以上這二種情況,需要透過授權,或主張合理使用,以排除著作權侵害之法律爭議。美國聯邦法院近年來陸續審理有關大數據分析與資料探勘案件,有助於判斷資料探勘是否符合合理使用之要件,例如,2014年White v. West案[15],涉及引用文本資料進行資料分析,法院認為構成合理使用。
在White v. West乙案,原告Edward White and Kenneth Elan二位律師,控告Westlaw 與LexisNexis兩間法律資料庫的出版商,在Pacer資料庫中下載White律師所遞交法院的檔案,並於資料庫中重製其法律著作,使得使用者得以使用。但Westlaw and LexisNexis針對White律師的著作權侵權控告,主張合理使用,被告認為雖藉有重製法律文件,但已加上Metadata(中繼資料)以描述所儲存的法律檔案,[16]這種利用行為同時創造了一個法律研究的互動工具,讓使用者可以透過Metadata資料,可與法律資料庫其他資料互動,搜尋其他相關檔案,這是一種轉換性合理使用。法院適用美國著作權107條合理使用分析,並強調Westlaw與LexisNexis重製White的資料,但其增加其他中繼資料以創建法律研究互動工具,已經構成轉換性使用之合理使用。
European Commission, Communication From The Commission To The European Parliament, The Council, The European Economic And Social Committee And The Committee Of The Regions Towards A Modern, More European Copyright Framework, Brussels, 9.12.2015 COM(2015) 626 final, ec.europa.eu/.../1-2015-626-EN-F1-1.PDF
U.S. White House, Big Data: Seizing Opportunities, Preserving Values, May, 2014, page
EC: Big data refers to large amounts of data produced very quickly by a high number of diverse sources. ec.europa.eu/.../big-data
See ISO/IEC (the International Organization for Standardization/the international Electrotechnical Commission) standard ISO/IEC 2382:2015 (en), Information Technology – Vocabulary. See www.iso.org/...
[1979] Crim LR 119, where it was held that confidential information in an exam question was not ‘intangible property’ within the meaning of Section 4(1) of the Theft Act 1968 and so could not be stolen
International News Service v. Associated Press, 248 U.S. 215 (1918)
0 Floyd J gave judgment in the UK High Court on 23 April 2010 ([2010] EWHC 841 (ch) - www.bailii.org/.../841.html). The CoA gave judgement on appeal from Floyd J’s decision on 9 December 2012 ([2010] EWHC 1380 - www.bailii.org/.../1380.html). The ECJ gave judgment on the questions referred to it by the CoA on 1 March 2012 (Case C-604/10 - curia.europa.eu/.../document.jsf). The CoA finally decided on 20 November 2012.