互联网与数据库争议

伟博观点

网络爬虫技术—大数据下的知识产权侵权

2019年,美国一项引起了关于“网络爬虫”的合法性以及澳大利亚法院会如何解释这种行为的讨论。在 HiQ Labs, Inc. v. LinkedIn Corp (2019) 938 F.3d 985 一案中,HiQ Labs这家分析公司利用 “网络爬虫”技术收集互联网上有关公司员工的数据,然后对其进行分析、以衡量员工的跳槽风险。LinkedIn是一个在线社交网络平台,提供了数以百万计的公开档案,其中包含用户的工作历史、学业和工作成就以及工作社交圈等信息。

知识产权如何为大数据提供保护

“大数据”是一个近些年来才出现的全新概念,其指的是人类借助各种技术与智能设备所创造出的连续、庞大且看似无限的数据流。换句话讲,“大数据”是指以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,是对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态”。

版权对数据的保护

版权在什么情况下会保护数据?
在澳大利亚,如果数据(data)满足了《1968 年版权法(联邦)》规定的门槛要求,则可以被视为受版权保护的作品。如果作者的作品将汇编内容压缩为物质形式,包括数字形式,并且其过程中涉及到一些旨在表达作品的智力活动、而非仅仅是收集或输入数据的过程,那么版权就会自动保护这类数据。因此对于一个数据集,版权是否对其进行保护不是一个确定的答案,需要根据个案进行判断。

常⻅问题与回答

如果某个数据受版权保护,《1968 年版权法(联邦)》会在特定时期内授予版权所有者某些针对该数据的专有权利,例如,一旦创作了符合版权要求的数据,创造者将自动享有复制、传播和出版的专有权利。

此外,版权法还会限制版权所有者、要求他们以合理用途的方式使用数据。数据的版权所有者可以通过申请许可(licences)的方式来管理数据版权的使用。如果版权所有者同意授权他人以特定形式使用其受版权保护的数据或数据集,则可以发布许可证,许可证可以包含允许使用数据或数据集的特定方式或限制,比如,有些版权所有者在许可证中规定,被授权使用者不能以商业模式重复使用其数据集。

对于不受版权保护的数据,创造者依然可以通过许可的方式管理其使用授权。在澳大利亚的实务中,通常很难分辨哪些数据受版权保护,在这种情况下,规定澳大利亚研究人员必须采取务实的方法,即假设在研究过程中创造的所有数据都存在版权,并确保相应地获得许可。

版权保护原创作品,其中通常包括收集与分析大数据的软件以及计算机程序这类作品。软件代码的作者是代码的程序员,与其他受版权保护的作品相同,对于符合版权要求的软件代码,代码的程序员无需去注册,在创建代码时就会自动享有相应的版权权利。

有时,作品的版权所有者并非创作者,类似情况也发生在软件代码这类作品中,通常,雇佣合同会规定程序员在工作期间的所有创造成果都归雇主所有,即雇主会成为代码的版权所有人。

与其他作品不同的是,软件项目通常包含大量代码,因此一个软件项目往往是由一组程序员编写完成。鉴于每一行代码都由编写的程序员所有,一个软件项目可能会涉及多个创作者。但这种情况并不会导致知识产权经理无法区分每个程序员的工作的现象,编写代码的软件会自动记录每个程序员的编写情况,并在每隔一段时间内生成作者列表,以便查看每个程序员的工作完成度。

使用版权保护源代码创作存在一个漏洞,由于版权只保护想法的“特定表达形式”,他人可以通过重写某一算法的方式以不同的形式来表达同一算法,这类“抄写”将属于版权保护的范畴之外。

在这种情况下,专利可以提供更广泛的保护,因为专利会涵盖专利算法(或一般发明)的所有不同表达。但是申请注册源代码专利也存在其他问题,专利仅在注册地提供知识产权保护,而对于软件和大数据的侵权可能发生在全球各地,因此要想实现注册专利对软件和大数据进行全方面的保护,程序员或源代码所有权人需要在每一个存在或可能存在利益冲突的国家或地区注册专利,如此一来,他们需要承担高额的成本,包括专利注册费和专利年费。

如果某些软件和大数据不符合专利注册的要求,或者代码所有权人不希望将其专利内容公开,则可以选择申请注册商业秘密。商业秘密是指对企业很重要的特殊见解或信息,对于企业雇佣的程序员创作的与企业交易相关的软件,企业往往不希望通过注册专利来进行保护,因为专利一旦注册则必须公开其信息。这种情况下,商业秘密可以为所有者提供竞争优势。

大众对于商业秘密可能存在误解,认为只要企业没有故意公开任何企业信息和技术,则此类信息就会受到商业秘密的保护。实际上,企业很难提供严格的保密程序。一旦公众知晓了企业的商业秘密,那么该企业可能无法采取任何的补救措施,并会因此而丧失掉相关的独占性权利。因此,为了保障企业信息和技术的秘密性,所有者需要将其申请注册为商业秘密,此方式还可以限制企业员工对此商业秘密的访问权,避免私下使用或泄露信息。在实务中,软件和大数据的所有者通常以注册实用专利和商业秘密相结合的方式来保护其知识产权。

“网络爬虫”又称网络蜘蛛、网络蚂蚁、网络机器人等,是指代替人工搜索、按照程序员制定的规则(即网络爬虫算法)在整个互联网浏览和筛选网络中的信息的技术,网络爬虫算法可以自动地在互联网中进行数据信息的采集与整理。

网络爬虫技术经常会在在大数据分析或数据挖掘时被使用,因为通过人工搜索和筛选相关信息的工作量太大,往往难以实现。目前,澳大利亚还未通过统一立法或制定规则来对网络爬虫技术进行监管,但是,如果未经作品的版权所有者的许可,利用网络爬虫技术从网站自动获取版权材料并在其他地方大量复制使用,则很可能会面临侵犯版权的风险。如果被告利用网络爬虫技术获取的是原创作品材料,比如图像、长段落的文本、视频或音频数据,那么作品的版权所有者的胜诉率就更高。

此外,如果利用网络爬虫技术获取他人已注册的商标或品牌并复制使用,则有可能会构成商标侵权行为,或者《澳大利亚消费者法》规定的误导性和欺骗行为。 如果某人利用网络爬虫技术使用他人已注册的商标,则可能会在注册商标所有者和网络爬虫算法服务网站之间造成误导性联系,根据《澳大利亚消费者法》,这可能会导致商标侵权诉讼、假冒诉讼或者误导和欺骗诉讼。

Translate »