北京知识产权司法保护研究会
所在位置: 法院动态> 详情
详情
张璇法官:不当抓取新浪微博数据,舆情服务公司被判500余万元






为进一步提升裁判文书质量,规范和加强裁判文书释法说理,打造精品裁判文书品牌,北京法院连续第七年在全市法院开展“优秀裁判文书网上互评活动”。经过初评、复评、总评三个阶段的评审,从全市三级法院推荐的裁判文书中,评选出一等奖10篇、二等奖20篇、三等奖30篇、优秀奖40篇,合计100篇。

 

今天为大家展示的是

一等奖裁判文书第九篇

某技术公司与某软件公司不正当竞争纠纷案

承办人是北京市海淀区人民法院

张璇法官

 

文书名称:某技术公司与某软件公司不正当竞争纠纷案

   号:(2018)京0108民初28643号

   院:北京市海淀区人民法院

办 人:张璇

案件类型:知识产权



感言

 

从事知产审判近五年,我深切地感受到裁判文书的撰写是一个需要不断反思、调整和训练的过程,是一段虽痛苦但快乐,既要付出代价但也能收获成长的经历。在包括本案在内的裁判文书写作中,我的努力方向是“多问”“多听”“多想”“多改”。

 

一是“多问”。“多问自己”,庭前阅卷问自己,如何引导当事人还原案件事实,归纳案件争议焦点;撰写文书再问自己,想传递出什么样的司法态度,如何加强说理等。“多问前辈”,既向书本和优秀裁判文书这些纸面上的“前辈”学习,也多与身边的同事“前辈”交流审判经验,确保裁判方向的准确和裁判尺度的统一。“多问专家”,通过与科研院所的老师们讨论基础问题,向技术、经济、文化等领域的专业人士咨询问题,扎实文书的理论基础和论述依据。

 

二是“多听”。“多听当事人意见”,让双方通过充分对抗展现案件事实的全貌。“多听合议庭意见”,开放地倾听才能碰撞出正确的思路。“多听自己的内心判断”,尤其在面对诸如本案这类涉及新竞争行为和竞争形态的案件时,既不能偏离法律规范,也不能违背市场规律,当法官内心据此充分衡量后就应坚定判断。

 

三是“多想”。“想全”,忌重实体轻程序,避免遗漏关键事实造成错误认定。“想深”,文书说理既要立足法律依据,也要依托理论支撑。“想远”,裁判文书不仅是针对案件本身作出的结论,亦可能对类案审理及市场行为产生影响,故要充分考虑裁判作出后的法律效果、政治效果和社会效果。

 

四是“多改”。“改失误”,一篇合格的裁判文书,首先要在形式上符合写作规范,故要杜绝出现文字性错误等不规范现象。“改模棱”,表达精确,避免使用带有歧义的用语。“改冗余”,好的裁判文书应当用语简洁精练,即能让同仁专家称道,也能让当事人等“圈外人”读明白、看得懂,因此,要避免不必要的、堆砌辞藻的长篇大论,甚至循环论证。

 

专家点评

 

中国人民大学法学院教授、博士生研究生导师

中国知识产权法学研究会常务理事

李琛

 

本案是一起与平台数据相关的不正当竞争纠纷。当前,平台数据日益成为市场主体重要的竞争资源,滋生的纠纷也不断增多。如何确定平台数据权益的归属以及相关竞争行为的边界,既是行业关注的热点,也是法律评价的难点。


该判决准确归纳了双方的争议焦点,从规范意义的角度提出了“公开数据”和“非公开数据”的划分,对竞争关系的认定、涉案数据的性质、数据抓取行为的正当性等问题进行了细致的分析与充分的说理,对平台数据相关私益之保护和信息流通之需求的关系进行了谨慎的权衡。此外,本案还通过现场勘验、专家辅助人出庭等方式查明事实,使判决建立在稳固的事实基础之上。

该判决逻辑严谨,说理清晰,不仅妥善地解决了个案,对类似案件的审理也具有参考价值,是一篇高质量的裁判文书。

 

基本案情

 

某技术公司系微博平台的运营者,提供社交平台服务;被告某软件公司系网页版、安卓手机端鹰击系统运营者,提供与舆情相关的数据采集和分析服务。技术公司认为,软件公司未经其许可,通过非法手段擅自抓取、存储、展示新浪微博后台数据,使鹰击系统用户在脱离微博平台的情况下可以实时查看、浏览大量新浪微博内容;此外,某软件公司还基于对新浪微博数据的整理分析形成数据分析报告后向用户提供。某技术公司认为,某软件公司实施前述行为妨碍、破坏了某技术公司提供的微博产品及服务的正常运行,构成不正当竞争。


某软件公司辩称某技术公司并非微博平台数据的权利人;某软件公司抓取的是微博平台前端数据,未实施抓取微博后台数据、存储数据的行为;运营的鹰击系统对开放的微博平台中数据进行采集和分析具有合理性,不会对微博构成实质性替代等。




精彩段落

 

(一)微博平台数据的类型区分

本案中,某技术公司主张某软件公司实施的被诉四项行为对其构成不正当竞争,损害了其对微博平台后端数据的权益。在对被诉行为性质进行判断之前,本院认为有必要对微博平台数据的类型进行一定区分和界定。虽双方均使用“前端数据”和“后端数据”之概念区分微博平台数据,但基于双方对该两类数据的理解和定义存在较大差异,且从技术角度看,使用前述概念区分微博平台数据或可能存在范围重叠之情形,或可能出现分类不严谨之问题。本院认为,从规范层面看,将微博平台数据做公开和非公开数据之区分更能体现法律意义。据此,在下文中,本院将对涉案微博平台数据使用“公开数据”和“非公开数据”之概念,以便于评述。

 

本案中,对于某技术公司未设定访问权限的数据,应属某技术公司已经在微博平台中向公众公开的数据;例如,用户在未登录状态下即可查看的新浪微博,系博主本身未限制他人浏览且某技术公司未通过登录规则等措施限制非用户浏览的数据,即为微博平台中的公开数据。但对于某技术公司通过登录规则或其他措施设置了访问权限的数据,则应属微博平台中的非公开数据;例如,本案中某技术公司主张的需用户登录后才可查看的,或在微博产品任何前端均不再展示故用户登录后亦不可查看的新浪微博,均属于微博平台中的非公开数据。据此,某技术公司在本案中主张的后端数据中既有公开数据,也有非公开数据。

 

网络平台通过自身经营活动吸引用户所积累的平台数据对平台经营者具有重要意义,是其重要的经营资源;平台经营者能通过经营使用这些数据获得相应的合法权益。但需要强调的是,基于网络环境中数据的可集成、可交互之特点,平台经营者应当在一定程度上容忍他人合法收集或利用其平台中已公开的数据,否则将可能阻碍以公益研究或其他有益用途为目的的数据运用,有违互联网互联互通之精神。具体到本案中,对于前述微博平台的公开数据,某技术公司并不会阻止用户在未登录微博帐号的状态下浏览、接收该部分信息甚至采取合法正当的途径进行二次利用。网络爬虫等技术手段虽系自动抓取网络数据的程序或脚本,但如其遵守通用的技术规则,亦无需访问权限即可访问上述微博平台公开数据。因此,无论是通过用户浏览或网络爬虫获取该部分数据,其行为本质均相同,某技术公司在无合理理由的情形下,不应对通过用户浏览和网络爬虫等自动化程序获取数据的行为进行区别性对待。

 

(二)某软件公司抓取的微博平台数据类型及该行为的性质

基于前文对微博平台数据类型的区分,某软件公司第一项被诉行为是否构成不正当竞争,关键在于判断其所抓取的数据是微博平台公开数据或非公开数据。对此,本院评述如下:

 

第一,鹰击系统中展示的新浪微博发布时间较之微博平台前端的发布时间更为精确,某软件公司虽称该展示效果系因其网络爬虫抓取了微博平台网页源代码中存在精确到秒的代码所致,但其并未就此提交证据;其专家辅助人所展示的微博平台网页爬虫视图截图来源及制作时间均不明确,不足以证明微博平台中微博精确到秒的发布时间系某技术公司未设定访问权限的公开数据。

 

第二,法庭勘验显示,在用户未登录状态下,仅可查看数量有限的新浪微博,仅可使用有限的微博平台功能,用户登录后才可访问到更多数据,使用更多功能。而根据某技术公司提交的公证书,当鹰击系统用户输入关键词时,不论是否属于微博平台用户登录后才可访问的微博平台数据,均可被实时采集和展示;此外,鹰击系统中的数据分析报告显示其监测到的、与一个关键词相关的新浪微博数量及内容均超出了用户在非登录状态下可正常访问到的内容。某软件公司称数据分析报告中显示的新浪微博数量包括了微博的转发数,明显与其产品逻辑矛盾;其所称“实时”采集仅指实时响应用户需求,亦与其公开宣传的产品特点存在矛盾。

 

第三,微博平台用户发布微博后自行删除或因其他原因被删除的微博,用户即便在登录状态下亦无权限查看,但这部分数据却可在鹰击系统中得到展示。根据某技术公司专家辅助人阐述,此部分数据虽在微博产品任何前端均无法展示,但仍存储在微博平台服务器中并需调用特定接口才可获取。某软件公司虽称该些数据系在其被删除之前即采集,但该种说法显然与其关于鹰击系统只有在用户输入相关关键词后才开始采集微博平台数据的说法存在矛盾。

 

据此,在某软件公司未就鹰击系统展示的微博平台数据不符合某技术公司所作正常的访问限制之情形进行合理解释并提交相应证据证明的情况下,本院认定某软件公司抓取的微博平台数据包括某技术公司已设置了访问权限的非公开数据。在某软件公司与某技术公司不存在合作关系的情形下,即便某软件公司自称系使用网络爬虫抓取微博平台数据属实,其要获取微博平台非公开数据,显然只能利用技术手段破坏或绕开某技术公司所设定的访问权限,而此种行为显然具有不当性。

 

此外,某技术公司在本案中主张包括微博平台公开数据的部分数据,理论上,某软件公司通过微博平台服务器抓取微博平台数据会同时抓取公开和非公开数据。据此,结合前述关于他人合法获取平台经营者已公开的数据系正当之论述,某软件公司抓取微博平台公开数据行为正当的要件之一为其抓取数据的手段系合法正当。但结合如下因素:第一,根据某技术公司提交的时间戳认证证书及法庭勘验,微博平台公开数据有其特定的展示规则,例如,需要用户行为触发才看查看更多的已公开微博评论;第二,某技术公司专家辅助人从技术层面对网络爬虫技术无法实现用户行为触发后才能展示的结果进行了合理解释,但某软件公司未就此做进一步回应或提交相反证据;因此,某软件公司关于其抓取微博平台公开数据系使用网络爬虫技术的辩称缺乏事实证明。综上,因某软件公司不能证明其系通过正常途径抓取微博平台公开数据,故即便鹰击系统中存在该部分数据,亦不能证明其该项行为正当。

 

 

扫描二维码查看裁判文书全文

 

来源:京法网事

 







公众号二维码
邮编:100010
秘书处:010-88829866
邮箱:bjippa@163.com
地址:北京市东城区建国门内大街7号
光华长安大厦2座1821

北京知识产权司法保护研究会 版权所有
京ICP备2020039752号-2