Category: 互联网与数据库争议

WB Legal > 知识产权法 > 互联网与数据库争议

网络爬虫技术—大数据下的知识产权侵权

网络爬虫技术—大数据下的知识产权侵权 2019年,美国一项引起了关于“网络爬虫”的合法性以及澳大利亚法院会如何解释这种行为的讨论。在 HiQ Labs, Inc. v. LinkedIn Corp (2019) 938 F.3d 985 一案中,HiQ Labs这家分析公司利用 “网络爬虫”技术收集互联网上有关公司员工的数据,然后对其进行分析、以衡量员工的跳槽风险。LinkedIn是一个在线社交网络平台,提供了数以百万计的公开档案,其中包含用户的工作历史、学业和工作成就以及工作社交圈等信息。而HiQ Lab的部分业务模式是从LinkedIn的成员公开档案中获取数据,然后为企业提供跳槽风险分析。对此 HiQ Lab利用…

知识产权如何为大数据提供保护

知识产权如何为大数据提供保护 “大数据”是一个近些年来才出现的全新概念,其指的是人类借助各种技术与智能设备所创造出的连续、庞大且看似无限的数据流。换句话讲,“大数据”是指以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,是对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态”。在利用大数据分析与挖掘技术来获得具有价值的信息时,最终成果可以通过知识产权进行法律保护,例如某一款软件可以用来对数据进行组织与分析,则此软件可以获得知识产权的专有保护。 源代码版权版权保护原创作品,其中通常包括收集与分析大数据的软件以及计算机程序这类作品。软件代码的作者是代码的程序员,与其他受版权保护的作品相同,对于符合版权要求的软件代码,代码的程序员无需去注册,在创建代码时就会自动享有相应的版权权利。有时,作品的版权所有者并非创作者,类似情况也发生在软件代码这类作品中,通常,雇佣合同会规定程序员在工作期间的所有创造成果都归雇主所有,即雇主会成为代码的版权所有人。 与其他作品不同的是,软件项目通常包含大量代码,因此一个软件项目往往是由一组程序员编写完成。鉴于每一行代码都由编写的程序员所有,一个软件项目可能会涉及多个创作者。但这种情况并不会导致知识产权经理无法区分每个程序员的工作的现象,编写代码的软件会自动记录每个程序员的编写情况,并在每隔一段时间内生成作者列表,以便查看每个程序员的工作完成度。 实用专利 使用版权保护源代码创作存在一个漏洞,由于版权只保护想法的“特定表达形式”,他人可以通过重写某一算法的方式以不同的形式来表达同一算法,这类“抄写”将属于版权保护的范畴之外。在这种情况下,专利可以提供更广泛的保护,因为专利会涵盖专利算法(或一般发明)的所有不同表达。 但是申请注册源代码专利也存在其他问题,专利仅在注册地提供知识产权保护,而对于软件和大数据的侵权可能发生在全球各地,因此要想实现注册专利对软件和大数据进行全方面的保护,程序员或源代码所有权人需要在每一个存在或可能存在利益冲突的国家或地区注册专利,如此一来,他们需要承担高额的成本,包括专利注册费和专利年费。 由于大数据从本质上讲是一种数据流,往很难符合实用专利的要求,一般情况下,大数据本身不能获得专利权,但是那些专门用来分析大数据的算法可能成功获得专利保护。专利申请要求所申请的技术需要满足新颖性、创造性和技术实用性的要求,其中,“技术实用性”要求可能会成为申请软件和大数据专利的障碍,因为“技术实用性”这个概念会随时间而变化,并且没有可确定的标准,再加上软件和大数据的本质是抽象的数学算法,程序员或源代码所有权人很难证明这类标的可以作为技术解决方案。实务中,申请人一般会通过证明将此软件和大数据注册为“技术发明”会对生产有益来申请注册专利,其中可接受的“益处”包括: 软件提供高效的计算机科学算法,从而可以减少 CPU 时间并减少内存;软件提供高效的数据结构,包括将数据转换为用于 ML 的图像的图形数据库;软件提供高效的用户界面属于交互式,更快速。 商业秘密如果某些软件和大数据不符合专利注册的要求,或者代码所有权人不希望将其专利内容公开,则可以选择申请注册商业秘密。商业秘密是指对企业很重要的特殊见解或信息,对于企业雇佣的程序员创作的与企业交易相关的软件,企业往往不希望通过注册专利来进行保护,因为专利一旦注册则必须公开其信息。这种情况下,商业秘密可以为所有者提供竞争优势。 大众对于商业秘密可能存在误解,认为只要企业没有故意公开任何企业信息和技术,则此类信息就会受到商业秘密的保护。实际上,企业很难提供严格的保密程序。一旦公众知晓了企业的商业秘密,那么该企业可能无法采取任何的补救措施,并会因此而丧失掉相关的独占性权利。因此,为了保障企业信息和技术的秘密性,所有者需要将其申请注册为商业秘密,此方式还可以限制企业员工对此商业秘密的访问权,避免私下使用或泄露信息。 在实务中,软件和大数据的所有者通常以注册实用专利和商业秘密相结合的方式来保护其知识产权。 软件和大数据的商业模式和相关 IP…

版权对数据的保护

版权对数据的保护 版权在什么情况下会保护数据?在澳大利亚,如果数据(data)满足了《1968 年版权法(联邦)》规定的门槛要求,则可以被视为受版权保护的作品。如果作者的作品将汇编内容压缩为物质形式,包括数字形式,并且其过程中涉及到一些旨在表达作品的智力活动、而非仅仅是收集或输入数据的过程,那么版权就会自动保护这类数据。因此对于一个数据集,版权是否对其进行保护不是一个确定的答案,需要根据个案进行判断。 对于版权保护哪些数据的问题,澳洲联邦法院在Telstra v Telephone Directorys 一案的判决中就该主题提供了一些指导。显然,完全由机器生成、编译和表达的数据中是不会受到版权保护的,因为此过程中未涉及旨在表达作品的智力活动。但同时,我们往往会面对如何界定机器生成的数据这个问题,例如,如果科学家通过重新编译、添加或减去、注释、更正或重新格式化数据集的方式来操作机器生成的数据,则可能会使数据集受到版权保护,因为科学家的上述操作可能会满足《1968 年版权法(联邦)》规定的门槛要求,即具有原创性、创造性和作者身份要求。 对于满足门槛要求的数据集,《1968 年版权法(联邦)》会自动为此类数据集提供版权保护,创造者无需采取任何措施。但是在实务中,创造者通常很难确定其创造的数据集是否受版权保护,因此,为了保险起见,建议创造者申请版权许可。版权许可会表明申请的数据或数据集受版权保护的范围以及许可条款的限制。 如果某数据具有版权,这意味着什么?如果某个数据受版权保护,《1968 年版权法(联邦)》会在特定时期内授予版权所有者某些针对该数据的专有权利,例如,一旦创作了符合版权要求的数据,创造者将自动享有复制、传播和出版的专有权利。此外,版权法还会限制版权所有者、要求他们以合理用途的方式使用数据。 数据的版权所有者可以通过申请许可(licences)的方式来管理数据版权的使用。如果版权所有者同意授权他人以特定形式使用其受版权保护的数据或数据集,则可以发布许可证,许可证可以包含允许使用数据或数据集的特定方式或限制,比如,有些版权所有者在许可证中规定,被授权使用者不能以商业模式重复使用其数据集。 对于不受版权保护的数据,创造者依然可以通过许可的方式管理其使用授权。在澳大利亚的实务中,通常很难分辨哪些数据受版权保护,在这种情况下,规定澳大利亚研究人员必须采取务实的方法,即假设在研究过程中创造的所有数据都存在版权,并确保相应地获得许可。 谁将拥有数据的版权?如果存在以下情况,将很难分辨数据版权的所有人: 某人受雇于澳大利亚的大学担任学术人员;某人受雇于澳大利亚的大学担任普通员工;某人是澳大利亚的大学的访问学者;某人是澳大利亚大学的学生;某人与大学联合任命(例如医院的临床工作人员);某人拥有大学的名誉职位。 在这些情况下,解决数据版权归属问题的一般规则是:如果数据产品是由雇员在正常工作过程中创造的,该数据产品的版权将属于该雇员的雇主。然而,澳大利亚的大学对此有不同的规定,他们为了鼓励其研究人员的工作,规定数据产品的版权将归属于研究人员本人。但不同大学的政策差异很大,尽管所有的澳大利亚大学都会发布知识产权政策,其中包括关于出版物和其他研究成果的所有权声明,但具体细节和操作流程会因不同大学的规定而异。一些大学还制定了数据研究的管理政策,其中可能包括有关数据版权的所有权的规定。总体来说,澳大利亚的大学通常会采取以下政策:…
Translate »