"Шифрованные" редиректы на JavaScript и Google
Гугль банит ваши дорвеи? Используете "шифрованные" редиректы? Тогда не удивляйтесь что ваши сайты/дорвеи пачками в
Гугль банит ваши дорвеи? Используете "шифрованные" редиректы? Тогда не удивляйтесь что ваши сайты/дорвеи пачками вылетают из индекса. Имхо, на самом деле шифрованные редиректы не несут никакой пользы, они могут помочь только при создании malware, чтобы антивирус не смог определить, что делает javascript код.
Не так давно я находил информацию о том какую open-source библиотеку Google использует для индексирования flash файлов. На самом деле зачем изобретать велосипед и с нуля писать что-то новое, к примеру есть задача определить что за javascript код на странице, собственно если есть готовые браузерные движки Gecko, Webkit зачем писать свой с нуля. Зачем гуглеботу расшифровывать javascript, если он может послать другого бота, построенного на браузерном движке и просто выполнить этот код, посмотреть что он делает. Думаете они не станут этим заморачиваться? :) Как насчет этого:
We employ the mapreduce [7] framework to process billions of web pages in parallel. For each web page, we extract several features, some of which take advantage of the fact that many landing URLs are hijacked to include malicious payload(s) or to point to malicious payload(s) from a distribution site. For example, we use “out of place” IFRAMEs, obfuscated JavaScript, or IFRAMEs to known distribution sites as features. Using a specialized machine-learning framework [5], we translate these features into a likelihood score.
[5] Jermey Bem, Georges Harik, Joshua Levenberg, Noam Shazeer, and Simon Tong. Large scale machine learning and methods. US Patent: 7222127.
В этом исследовании они использовали непропатченный IE для выявления всякого malware, вполне возможно, что нечто подобное используется для выявления редиректов на дорвеях.