всички настройки
bookworm  ] [  trixie  ] [  sid  ]
[ Източник: html-text  ]

Пакет: python3-html-text (0.6.2-1)

Връзки за python3-html-text

Screenshot

Ресурси за Debian:

Изтегляне на пакет-източник html-text.

Отговорник:

Външни препратки:

Подобни пакети:

extract text from HTML.

How is html_text different from .xpath('//text()') from LXML or .get_text() from Beautiful Soup ?

 * Text extracted with html_text does not contain inline styles,
   javascript, comments and other text that is not normally visible to
   users;
 * html_text normalizes whitespace, but in a way smarter than
   .xpath('normalize-space()), adding spaces around inline elements (which
   are often used as block elements in html markup), and trying to avoid
   adding extra spaces for punctuation;
 * html-text can add newlines (e.g. after headers or paragraphs), so that
   the output text looks more like how it is rendered in browsers.

Други пакети, свързани с python3-html-text

  • зависимости
  • препоръчани
  • предложени
  • enhances

Изтегляне на python3-html-text

Изтегляне за всички налични архитектури
Архитектура Големина на пакета Големина след инсталиране Файлове
all 9,6 кБ41,0 кБ [списък на файловете]