YouTube的版权系统真的很厉害

一直以来,很多人以为youtube视频原创检测不可能像文字那么容易,但是Google毕竟是Google,最牛逼的工程师在那里,牛逼的技术也从那里诞生,用户上传的每一个视频都抽取出某种指纹信息,然后再与所有的版权内容相比较。

也许是从一部小制作电影里随机裁剪出来的小视频,他们也能在上传后的几十份内发现,并给出邮件提醒。

音乐更是比较严格,基本上出名点的音乐都会很快的提示。

将用户上传的每一个视频跟数据库里的所有参考文件进行对比。下面的热图展示了核心系统是如何工作的

20130807163849015

我们看到,一个参考文件正被用于与用户生成的内容进行比对。系统会把一个文件的每个时间点跟另一个文件比较,以发现两者之间存在的匹配。这也意味着,即使用户只是从原始文件里抽取了一部分,或者以慢动作播放,甚至损失了音频或视频的质量,我们照样能匹配出来。

这个系统的规模和执行速度是很惊人的——我们可不是只需处理几个视频,而是每天要处理大约100多年时长的新上传视频;除此之外,我们还会定期地对网站上留存的所有视频进行全面的扫描。在比较那些100年长度的视频时,我们实际上是在将它们与数据库里的几百万个参考文件作比较。就像每天有36000个人紧紧盯着36000个显示器一样,没有一丝一毫的停歇。

目前有3种“使用政策”,分别是“禁止”、“跟踪”和“货币化”。如果版权所有人指定了“禁止”政策,用户上传的视频在YouTube网站上就不会被别人看到。如果版权所有人指定了“跟踪”政策,用户上传的视频会出现在YouTube上,但版权所有人会收到关于这个视频的统计信息,比如这个视频被看了多少次。如果是“货币化”政策,用户上传的视频也会出现在YouTube上,只不过视频播放时会插入广告。这些政策是可以根据地理区域设定的,因此版权所有人可以控制某些内容在一个国家可见,而让其他国家的用户看不到。