Как извлечь все URL из сеанса Firefox sessionstore

sed -e "s/\[{/\n/g" -e "s/}, {/\n/g" sessionstore.js | grep url | awk -F"," '{ print $1 }'| sed -e "s/url:\"\([^\"]*\)\"/\1/g" -e "/^about:blank/d" > session_urls.txt


Команда «sed -e «s/\[{/\n/g» -e «s/}, {/\n/g» sessionstore.js» выполняет замену символов в файле sessionstore.js. Она заменяет все вхождения «[{» на новую строку и заменяет все вхождения «}, {» на новую строку.

Команда «grep url» фильтрует строки, оставляя только те, которые содержат подстроку «url».

Команда «awk -F»,» ‘{ print $1 }'» используется для извлечения первого поля из каждой строки, разделенной запятой.

Команда «sed -e «s/url:\»\([^\»]*\)\»/\1/g»» выполняет замену строк, которые совпадают с шаблоном «url:\»что-то\»», на «что-то». Это извлекает URL из строк, содержащих «url».

Команда «/^about:blank/d» исключает строки, начинающиеся с «about:blank».

Наконец, символ «>» используется для перенаправления вывода команды в файл session_urls.txt.

Альтернативным способом извлечения URL из сеанса Firefox sessionstore может быть использование инструментов, таких как Python и библиотека json.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *