网络爬虫技术—大数据下的知识产权侵权

WB Legal > 知识产权法 > 互联网与数据库争议 > 网络爬虫技术—大数据下的知识产权侵权

网络爬虫技术—大数据下的知识产权侵权

2019年,美国一项引起了关于“网络爬虫”的合法性以及澳大利亚法院会如何解释这种行为的讨论。在 HiQ Labs, Inc. v. LinkedIn Corp (2019) 938 F.3d 985 一案中,HiQ Labs这家分析公司利用 “网络爬虫”技术收集互联网上有关公司员工的数据,然后对其进行分析、以衡量员工的跳槽风险。LinkedIn是一个在线社交网络平台,提供了数以百万计的公开档案,其中包含用户的工作历史、学业和工作成就以及工作社交圈等信息。而HiQ Lab的部分业务模式是从LinkedIn的成员公开档案中获取数据,然后为企业提供跳槽风险分析。对此 HiQ Lab利用 “网络爬虫”技术获取网络公开数据的行为,美国法院讨论了这是否构成《美国计算机和欺诈滥用法》规定的未经授权的访问行为。

什么是“网络爬虫”技术?
“网络爬虫”又称网络蜘蛛、网络蚂蚁、网络机器人等,是指代替人工搜索、按照程序员制定的规则(即网络爬虫算法)在整个互联网浏览和筛选网络中的信息的技术,网络爬虫算法可以自动地在互联网中进行数据信息的采集与整理。网络爬虫技术经常会在在大数据分析或数据挖掘时被使用,因为通过人工搜索和筛选相关信息的工作量太大,往往难以实现。

目前,澳大利亚还未通过统一立法或制定规则来对网络爬虫技术进行监管,但实务中,使用网络爬虫技术的现象非常普遍,例如,价格比较网站往往会通过网络爬虫技术来复制电子零售商网站的电视价格,从而将它们提交到感兴趣的客户的可搜索列表中。

利用网络爬虫进行数据采集:侵犯版权的风险

如果未经作品的版权所有者的许可,利用网络爬虫技术从网站自动获取版权材料并在其他地方大量复制使用,则很可能会面临侵犯版权的风险。在实务中,原告要想成功主张被告因使用网络爬虫而造成了侵犯版权的行为,其诉讼中必须包含以下关键因素:

  • 通过网络爬虫技术获取的信息或材料已经获得了版权自动保护;以及
  • 被告未经版权所有者的许可,以实质性形式大量复制该材料或信息。

如果被告利用网络爬虫技术获取的是原创作品材料,比如图像、长段落的文本、视频或音频数据,那么作品的版权所有者的胜诉率就更高。换句话说,如果 HiQ Labs利用网络爬虫技术获取并复制LinkedIn用户发布的原创文章的内容,则更有可能构成版权侵权行为。

商标侵权、传递或误导性、欺骗性行为

如果利用网络爬虫技术获取他人已注册的商标或品牌并复制使用,则有可能会构成商标侵权行为,或者《澳大利亚消费者法》规定的误导性和欺骗行为。 如果某人利用网络爬虫技术使用他人已注册的商标,则可能会在注册商标所有者和网络爬虫算法服务网站之间造成误导性联系,根据《澳大利亚消费者法》,这可能会导致商标侵权诉讼、假冒诉讼或者误导和欺骗诉讼。

违约
如果他人利用网络爬虫技术获取并使用您在网站发布的信息或资料,但这些信息或资料并未收到任何知识产权的保护,那么则无法以知识产权侵权为由诉讼。在这种情况下,您可以考虑是否构成违约行为。通常,网站使用条款或在线服务的用户条款都会标明禁止复制数据,有些网站还会明确表示禁止用户使用网络爬虫技术获取该网站的信息,如果相关网站的使用条款明确禁止出于商业目的而利用网络爬虫算法获取该网站数据,而他人依然利用此类算法或计算机服务获取信息,根据澳洲法律,这会构成合同违约行为。但目前来看,澳洲司法还没有审议过网络爬虫引起的违约诉讼。

此类违约诉讼涉及到一个关键问题:使用网络爬虫技术的本人是否应当属于网站使用条款合同的合同当事方?在澳洲,如果网站对于使用条款采取“点击即同意”的模式,则很大概率可以认定为使用网络爬虫技术的本人即属于合同当事方,并且网站运营商可以起诉其违约行为。但是,如果网站的服务条款采取“浏览合同”的模式,即用户在访问网站之前不需要通过“点击确定”等明确操作接受这些条款、浏览即视为同意该条款,澳洲合同法不会将次认定为合同或违约。

您有知识产权方面的困惑或者需要法律咨询,请致电1300 487 888。

Leave a Reply

Your email address will not be published.

Translate »