Скобарь Posted December 24, 2013 Report Share Posted December 24, 2013 Бывает зальёшь куда-нибудь фильм, а перед этим переконвертируешь, название, формат, битрейт, разрешение и пр. поменяешь и думаешь, правообладатель до тебя не доберётся. Ан нет: даже так копираст находит его и требует удалить "пиратку". Вопрос: как они это делают? Как находят, когда ты и имя файлу своё дал (и в "свойствах" тоже его подправил) и при заливке он в добавок переконвертировался самим сайтом? Я спрашиваю вовсе не для того, чтобы вволю "попиратствовать", просто хочу тоже так же уметь находить на просторах Интернета нужный контент. Да и интересно всё-таки. Link to comment Share on other sites More sharing options...
Yezhishe Posted December 24, 2013 Report Share Posted December 24, 2013 По фрагментам. По ключевым фразам. По ключевым кадрам. Много вариантов. Link to comment Share on other sites More sharing options...
asd62 Posted December 25, 2013 Report Share Posted December 25, 2013 Есть специальные ресурсы, типа "антиплагиат". С их помощью в основном и ищут. Link to comment Share on other sites More sharing options...
Yezhishe Posted December 25, 2013 Report Share Posted December 25, 2013 У нас тут - домыслы & предположения максимум, а вообще - наилучшим образом об этом осведомлены те, кто успешно ищет. Наверное, резонно было бы спросить у них, не? Link to comment Share on other sites More sharing options...
asd62 Posted December 25, 2013 Report Share Posted December 25, 2013 Ну почему домыслы. Я часто проверяю текст на оригинальность, прежде чем опубликовать написанное мною стихотворение. То есть в данном случае действуя от обратного. Через антиплагиат искал свои стихи. Находил, практически везде с указанием авторства, правда без ссылки на мой блог, но претензий не предъявлял, стесняюсь так сказать. И в паре мест без указания авторства, но сайты такие, что там никак не пробёшься к администраторам, что бы пожаловаться. Они видимо специально так и организованы, так куча текстов, различных авторов, в том числе знакомых мне, без малейшей попытки указать авторство. Link to comment Share on other sites More sharing options...
Yezhishe Posted December 25, 2013 Report Share Posted December 25, 2013 Под "домыслами" я имел в виду наши предположения по механизму поиска... Link to comment Share on other sites More sharing options...
Скобарь Posted December 25, 2013 Author Report Share Posted December 25, 2013 (edited) По фрагментам. По ключевым фразам. По ключевым кадрам. Много вариантов. Как выглядит поиск по фрагментам и ключевым кадрам? А по ключевым фразам - это вы имеете по фразам, сказанным в самом видео голосом или что? У нас тут - домыслы & предположения максимум, а вообще - наилучшим образом об этом осведомлены те, кто успешно ищет. Наверное, резонно было бы спросить у них, не? Резонно. Но я уже спросил тут. А как подкатить к тем, кто ищет даже и не знаю, ведь я же как бэ сам выкладываю...Узнают, так и пошлют может и разговаривать даже не станут... Edited December 25, 2013 by Скобарь Link to comment Share on other sites More sharing options...
asd62 Posted December 25, 2013 Report Share Posted December 25, 2013 А, тут я согласен. Link to comment Share on other sites More sharing options...
Скобарь Posted December 25, 2013 Author Report Share Posted December 25, 2013 Кстати, наткнулся тут на некий термин "цифровой отпечаток". Никто не подскажет каким методом его можно обналичить и каким макаром искать с ним по Интернету? Link to comment Share on other sites More sharing options...
edde Posted December 25, 2013 Report Share Posted December 25, 2013 (edited) «Цифровые отпечатки» (Digital Fingerprints или DG)Различного типа хеш-функции образцов конфиденциальных документов позиционируются западными разработчиками DLP-систем как новое слово на рынке защиты от утечек, хотя сама технология существует с 70-х годов. На Западе этот метод иногда называется «digital fingerprints». Суть всех методов одна и та же, хотя конкретные алгоритмы у каждого производителя могут отличаться. Некоторые алгоритмы даже патентуются, что помогает в продвижении «новой патентованной технологии DG». Общий сценарий действия такой: набирается база образцов конфиденциальных документов. Суть работы DG довольно проста и часто этим и привлекает: DLP/IPC-системе передается некий стандартный документ-шаблон, из него создается «цифровой отпечаток» и записывается в базу данных DF. Далее в правилах контентной фильтрации настраивается процентное соответствие шаблону из базы. Например, если настроить 75 % соответствие «цифровому отпечатку» договору поставки, то при контентной фильтрации DLP обнаружит практически все договоры этой формы. Иногда, к этой технологии относят и системы вроде «Антиплагиата», однако последняя работает только с текстовой информацией, в то время как технология «цифровых отпечатков», в зависимости от реализации, может работать и различным медийным контентом и применяться для защиты авторских прав и препятствию случайному или намеренному нарушению законов и нормативов информационной безопасности.К достоинствам технологии «цифровых отпечатков» (Digital Fingerprints) можно отнести простоту добавления новых шаблонов, довольно высокую степень детектирования и прозрачность алгоритма технологии для сотрудников подразделений по защите информации. Специалистам СБ и ИБ не надо думать о «стоп-выражениях» и прочей лингвистике, тратить много времени на анализ потенциально опасных словоформ и вбивать их в базу, тратить ресурсы на внедрение и поддержку лингвистической базы. Основным недостатком, который на первый взгляд неочевиден и скрыт за «патентованными технологиями», является то, что, несмотря на всю простоту и фактическое отсутствие лингвистических методов, необходимо постоянно обновлять базу данных «цифровых отпечатков». И если в случае с «сигнатурами», такой метод не требует постоянного обновления базы словами, то он требует обновления базы «цифровых отпечатков». К недостаткам «цифровых отпечатков» можно отнести то, что фактически от «дополнения базы словами» поддержка DLP в эффективном состоянии переходит «поиск и индексирование новых и измененных файлов», что является более сложной задачей, даже если это делается DLP-системой полуавтоматически. Крупные компании, в которых появляется до десятка тысяч новых и обновленных документов каждый рабочий день только на серверных хранилищах зачастую просто не в состоянии отслеживать всё это в режиме реального времени, не говоря уже об персональных компьютерах. В таком случае применение DG малоэффективно, поэтому «цифровые отпечатки» в большинстве DLP рассчитаны на компании SMB-сектора (менее 500 пользователей). В дополнение к этому цифровые отпечатки занимают примерно 10—15 % от размера конфиденциальных документов, и база постоянно разрастается, что требует дополнительных инвестиций в увеличение систем хранения информации и производительность DLP-серверов. Кроме того, низкоуровневые хеш-функции (в том числе и DG) неустойчивы к примитивному кодированию, которое рассматривалось применительно к «сигнатурам». Проще говоря это некая хеш сумма которая добавляется в заголовок файла и которую вы редактируя тэги потереть всё равно не сможете . Edited December 25, 2013 by edde Link to comment Share on other sites More sharing options...
Yezhishe Posted December 25, 2013 Report Share Posted December 25, 2013 А уж ежели к hash'у да и соль добавить... Практически-то - действительно "отпечаток пальца" (fingerprint) получается. Link to comment Share on other sites More sharing options...
Скобарь Posted December 25, 2013 Author Report Share Posted December 25, 2013 А не подскАжите мне други, как бы самому так "снайперски" контент по Интернету искать? Link to comment Share on other sites More sharing options...
edde Posted December 25, 2013 Report Share Posted December 25, 2013 https://www.google.com 1 Link to comment Share on other sites More sharing options...
Yezhishe Posted December 25, 2013 Report Share Posted December 25, 2013 i Уведомление:Поскольку тема явно исчерпала все возможности - закрываю.Волевым решением, ага... Ну и, традиционно - "Если что - в ПМ". Link to comment Share on other sites More sharing options...
Recommended Posts