[ Pakiet źródłowy: html-text ]
Pakiet: python3-html-text (0.7.0-1)
Odnośniki dla python3-html-text
Zasoby systemu Debian:
- Raporty o błędach
- Developer Information
- Dziennik zmian w systemie Debian
- Informacje nt. praw autorskich
- Śledzenie łatek systemu Debian
Pobieranie pakietu źródłowego html-text:
Opiekun:
Zasoby zewnętrzne:
- Strona internetowa [github.com]
Podobne pakiety:
extract text from HTML.
How is html_text different from .xpath('//text()') from LXML or .get_text() from Beautiful Soup ?
* Text extracted with html_text does not contain inline styles,
javascript, comments and other text that is not normally visible to
users;
* html_text normalizes whitespace, but in a way smarter than
.xpath('normalize-space()), adding spaces around inline elements (which
are often used as block elements in html markup), and trying to avoid
adding extra spaces for punctuation;
* html-text can add newlines (e.g. after headers or paragraphs), so that
the output text looks more like how it is rendered in browsers.
Inne pakiety związane z python3-html-text
|
|
|
|
-
- dep: python3
- Interaktywny, wysokopoziomowy i obiektowy język programowania (domyślna wersja Python 3)
-
- dep: python3-lxml
- pythonic binding for the libxml2 and libxslt libraries
-
- dep: python3-lxml-html-clean
- blocklist-based HTML cleaner
Pobieranie python3-html-text
| Architektura | Rozmiar pakietu | Rozmiar po instalacji | Pliki |
|---|---|---|---|
| all | 9,9 KiB | 40,0 KiB | [lista plików] |
