Headless browser


  • administrators

    @out Js имеет доступ к разметке страницы и ко многим другим вещам в браузере. Я понимаю о чем идет речь, но не знаю, как это можно реализовать. http://stackoverflow.com/questions/802225/how-do-i-use-mechanize-to-process-javascript Например, тут спрашивают почти о том же.
    Единственное решение, которое могу придумать - взять какой-то очень легкий браузерный движок и приделать его к хттп клиенту.



  • @support это было бы интересно, но не спеши с этим, т.к. пока это мало кому надо, может у тебя и так поважнее дела есть. Но на будущее было бы интересно..


  • administrators

    @out Да, я точно сейчас делать это не буду. Сейчас доделываю модуль для приема смс


  • administrators

    @out Нашел интересный флаг, --disable-threaded-compositing он отключает отрисовку страницы, но сохраняет приблизительно четверть памяти. Скриншоты делать нельзя, и могут возникнуть проблемы с капчей но js на странице работает. И еще он работает только в режиме записи. Этот флаг можно кидать в файл chrome_command_line.txt



  • @support Значит, без режима записи не будет работать, и Render() тоже не будет работать?


  • administrators

    @blackhacker --disable-threaded-compositing в новой версии не будет работать в режиме записи. С созданием скриншотов ничего не сделаешь, но некоторым скриптам это не нужно.



  • @support А как же распознание каптчи?



  • @blackhacker обычным гет запросом получать каптчу.
    другое дело , если рекаптча, то там да, отрисовка нужна (и то не всегда, смотря какой метод использовать)


  • administrators

    @blackhacker Обычную капчу можно получать или гет запросом или через кеш. Модуль рекапчи будет работать только с капмонстром, но в будущем не вижу проблем его переделать и для сервисов и ручного распознавания.


Log in to reply
 

Looks like your connection to Bablosoft was lost, please wait while we try to reconnect.