Сохранение веб страниц одним файлом

Интернет сегодня есть в каждом доме. Скорость позволяет быстро открывать веб-страницы, а непрерывность передачи сигнала не скачивать фильмы, а смотреть онлайн. Документы находятся в облачных хранилищах. Но все же многим пользователям порой нужно сохранить некоторые страницы браузеров, чтобы потом посмотреть их оффлайн. Поэтому будет детально разобран вопрос о том, как сохранить страницу одним файлом в Firefox.

Инструкция

В Фаерфоксе предусмотрено несколько способов для загрузки содержимого веб-сайтов на компьютер. Во-первых, все сделать можно непосредственно через встроенный функционал браузера. А во-вторых, существует специальное расширение Save Page WE, предназначенное для этих целей.

Метод №1: Встроенный функционал

Для начала перейдите на страницу, которую вы планируете загрузить к себе на компьютер. Теперь есть два варианта:

  • Воспользуйтесь сочетанием клавиш Ctrl + S.
  • Кликните ПКМ по свободной области, а затем выберите второй пункт.

Теперь укажите путь хранения и завершите процедуру.

Метод №2: Сторонний плагин

Для начала перейдите по ссылке https://addons.mozilla.org/ru/firefox/addon/save-page-we/. Здесь кликните на зеленую кнопку, а потом на «Добавить».Теперь в списке иконок для расширений появится новая, в виде устаревшей дискеты. Нажмите на нее, перейдя на нужную веб-страницу, чтобы активировать опцию сохранения. А теперь сделайте все так, как показано на скриншоте ниже:

Дополнение

В некоторых случаях пользователю Firefox нужно сохранить страницу сайта в формате PDF. Чтобы это сделать, выполните следующие шаги:

  1. Откройте нужный сайт в браузере «Огненная лисица».
  2. Нажмите на клавиатуре Ctrl + P. Тогда появится окно печати.
  3. В имя выберите Microsoft Print to PDF.
  4. Теперь кликните по кнопке «ОК».
  5. Укажите местоположение для будущего документа.

Введение

Идея сохранения любой веб-страницы в виде одного файла со всеми вложенными ресурсами не нова, и существует немало альтернатив. Например, веб-браузер Safari позволяет сохранять отдельные веб-страницы для просмотра в автономном режиме, сохраняя все элементы страницы в веб-архиве (расширение файла .webarchive). Есть также MHTML, формат веб-архива, который аналогичным образом сохраняет веб-страницы в одном файле. Есть даже оффлайн-браузеры (привет модемные подключения и ночные дозвоны до провайдера!) со своими собственными форматами хранения данных (хотя они немного сложнее чем просто сохранение страниц, там они целые сайты сохраняли)

Но у всех описанных выше средств есть некоторые ограничения, такие как требование использования определенного браузера или стороннего клиента для просмотра полученного результата. Например, вы можете сохранять и просматривать файлы .webarchive только с помощью веб-браузера Safari и некоторых сторонних решений. Что касается MHTML, он больше не поддерживается для просмотра в Firefox, да и Google Chrome недавно удалил пользовательский флаг # save-page-as-mhtml, который ранее позволял сохранять веб-страницы как MHTML (возможно есть некоторые расширения, которые возвращают эту функциональность, я не проверял).

Читайте также:  После выхода из спящего режима пропадает звук

Так как же сохранить файлы чтобы было удобно и не было так неряшливо как куча файлов и директорий?

Решение

Есть программа Monolith, это инструмент командной строки для сохранения любой веб-страницы в виде одного HTML-файла, который будет содержать в себе всё необходимое для локального отображения веб-страницы, без необходимости подключения к Интернету, и вы можете использовать любой веб-браузер для их просмотра. Это означает, что вы не полагаетесь на какие-либо сторонние решения, и вам не нужны веб-браузеры, чтобы продолжать поддерживать формат веб-архива, обеспечивая защиту ваших локально сохраненных веб-страниц в будущем.

Эта программа может вам пригодиться чтобы сохранять веб-страницы содержащие документацию, вики-статьи и всё-всё что вас заинтересует, для локального / автономного использования. Поскольку веб-страницы сохраняются в обычном формате HTML, вы сможете использовать обычные инструменты поиска в файлах, чтобы быстро найти нужную веб-страницу.

Обычная опция «Сохранить страницу как» (или Ctrl + s) (предоставляемая веб-браузерами для сохранения веб-страниц на вашем компьютере) сохраняет ресурсы веб-страниц в папке рядом с сохраненной веб-страницей. Monolith же извлекает активное содержимое веб-страницы и преобразует его в данные закодированные base64, подставляя их затем в документе вместо обычных URL-адресов. В результате ресурсы страницы, такие как Javascript, CSS или изображения, встроены в HTML-код страницы, поэтому все, что вам нужно, — это веб-браузер для доступа к локально сохраненной веб-странице.

Инструмент также предоставляет 2 полезных параметра: -i для удаления изображений с сохраненных веб-страниц и -j для исключения JavaScript.

Изначально Monolith использовал Node.js, но совсем недавно был переписан на Rust. В настоящее время он неплохо работает для большинства страниц, но есть еще несколько вещей, которые требуют доработки.

Недостатки

Например, встраивание импорта CSS и веб-шрифтов в настоящее время не поддерживается, хотя похоже что разработчик планирует реализовать это в ближайшее время.

Так же не работает пока сохранение веб-страниц, требующих аутентификации. Кроме того, не работает сохранение встроенных видео, но это в любом случае не может быть осуществимо, поскольку встраивание видео в виде base64-данных приведет к созданию очень большого HTML-файла, и если вы захотите отредактировать HTML-файл, это будет боль.

Стоит также отметить, что Monolith сохраняет то, что находится на веб-странице, когда она загружается, поэтому он не будет хорошо работать с веб-сайтами, которые реализуют бесконечную прокрутку. Во первых это реализуется по-разному, в зависимости от веб-сайта (когда я тестировал — сохранялось только начало, как если бы прокрутку никто не трогал). Это, видимо, везде где реализована ленивая загрузка данных.

Установка

Для установки Monolith мы будем использовать Cargo — систему сборки Rust и менеджер пакетов. Вам также необходимо установить OpenSSL (devel), чтобы собрать Monolith. Установите это всё в Linux, используя:

Читайте также:  Nokia 3310 синтезатор мелодий

Debian / Ubuntu / Linux Mint / Pop!_OS, etc.:

Работая в глобальной сети, мы иногда сталкиваемся с информацией на различных сайтах, которая является для нас особо ценной и полезной. Веб-страницы с такими сведениями сразу же хочется сохранить отдельно на жёсткий диск для просмотра offline.

Это будет вполне разумно в том случае, если у вас вдруг возникнут какие-либо проблемы с соединением или сам сайт, где вы изначально нашли информацию, станет недоступен.

Однако сразу в двух самых популярных альтернативных браузерах – Mozilla Firefox и Google Chrome, опция сохранения страниц весьма далека от идеала.

Основное неудобство здесь заключается в том, что любая веб-страничка, которую вы решите сохранить, будет спроецирована на ваш жёсткий диск в виде html-файла и целой папки с различным контентом этой страницы. Если сохранять вам приходится достаточно часто, то уже через некоторое время на рабочем столе или любой папке, куда вы складываете файлы, образуется настоящий хаос. Более того, файл html и связанная с ним папка неотделимы друг от друга, то есть, если случайно удалите одно из них, – второе вы уже не посмотрите.

Поэтому гораздо удобнее сохранять веб-страницы в единый файл. Такой файл имеет расширение .mht (MHTML) и называется веб-архивом (но его не стоит путать с .webarchive в Apple Safari, так как это разные несовместимые между собой форматы).

Как ни странно, первым браузером, предложившим поддержку MHT, в далёком 1999 году стал Internet Explorer 5.0. В 2006 году в версии 9.0 эту же технологию впервые взяла на вооружение норвежская Opera. Уже в Opera 9.5 MHT стал форматом сохранения по умолчанию.

В отличие от Internet Explorer и Opera, в двух других не менее популярных браузерах – Firefox и Chrome поддержки данного формата сейчас нет, что часто доставляет неудобства их пользователям.

Впрочем, исправить эту проблему совсем не сложно.

Итак, добавить поддержку MHT в Firefox легко и просто можно при помощи расширения UnMHT. Для того чтобы это сделать – запустите браузер, в главном меню кликните по разделу «дополнения».

Далее, в окне поиска введите «UnMHT» без кавычек, нажмите Enter. Щёлкните по кнопке «установить» напротив первого расширения в полученном списке.

Теперь любую веб-страницу в интернете вы можете сохранить одним файлом. Для этого достаточно лишь выбрать новый пункт «сохранить как MHT» в её контекстном меню.

Если каждый раз открывать контекстное меню вам неудобно, то управляющие иконки UnMHT можно вынести прямо на основную панель инструментов.

Читайте также:  Windows 7 максимальная пиратка

Для этого откройте главное меню, а в нём «настройки» –>«панель инструментов».

В самом низу появившегося окна вы найдёте новые кнопки от установленного только что UnMHT. Любую из них можно перенести на основную панель простым перетаскиванием.

Расширение UnMHT обладает целым арсеналом всевозможных дополнительных настроек и функций.

Самой удобной среди них нам, безусловно, показалась возможность в два клика сохранить все открытые в данный момент в Firefox вкладки. Ничего подобного в других веб-обозревателях мы, к сожалению, не видели.

С недавнего времени добавить поддержку формата MHT можно и в Chrome. В 18 версии этого браузера компания Google предоставила специальные API, позволяющие независимым разработчикам создавать расширения для сохранения содержимого вкладок в формате MHT. Первое из таких расширений – Save AS MHTML.

При первом знакомстве с ним нас ждало некоторое разочарование. Модуль успешно установился, однако свою ключевую функцию по каким-то (скорее всего временным) причинам выполнить не смог.

Впрочем, ждать пока разработчик исправит проблемы в своём расширении, пользователям не обязательно. Ситуация здесь кардинально изменилась после того, как Google неожиданно решила самостоятельно выполнить работу по добавлению полной поддержки MHT в свой браузер.

Уже сейчас можно активировать эту экспериментальную опцию в тестовых (canary) сборках программы, а уже скоро она станет доступна к выбору и в стабильных релизах.

Итак, чтобы включить поддержку MHT в Google Chrome наберите в адресной строке браузера текст «chrome://flags», после чего нажмите «Enter». В результате вы попадёте на страницу экспериментальных возможностей Chrome, о которой мы уже подробно рассказывали в одной из прошлых статей.

Далее вам лишь остаётся найти и активировать там пункт «Save Page as MHTML»,

после чего перезапустить браузер:

В результате, стандартный диалог сохранения страниц, начнёт сохранять информацию MHT-файлами.

Уже скоро данная функция и вовсе будет включена по умолчанию, что в итоге лишь подтверждает общее мнение об удобстве сохранения веб-страниц в виде единых файлов.

P.S. Так как речь в этом материале вновь зашла о браузерах и их функциях, то мы, пользуясь случаем, хотим обратить ваше внимание на ещё одну связанную с ними новость последних дней.

Напомним, уже совсем скоро компания Mozilla готовится представить 13 версию своего веб-обозревателя Firefox. Одним из наиболее интересных новшеств в ней должна стать новая опция программного сброса (Firefox Reset), о которой мы уже упоминали в предыдущих статьях.

Сегодня же мы предлагаем вам ознакомиться с наглядной видеодемонстрацией того, как работает данная возможность.