PDA

Ver Versão Completa : Linux-Converter-HTML-para-PDF



gu1le
06-09-2017, 10:42
2017

.


A gente pode fazer epub de qualquer tipo de texto que existe na internet hoje em dia. E se o ePub ainda não existe amiga(o) você cria!

.

Veja só:

.


Como fazer para converter uma página em HTML para PDF?

.

Abro o terminal e por minha conta e risco executo este tutorial.

.

Uso o wkhtmltopdf.

.

Para saber mais, saber como instalar, compilar para qualquer Distro, etc... Visito:

.

https://wkhtmltopdf.org/ (https://wkhtmltopdf.org/)

.

Distros Debian e derivados:

.


sudo apt-get install wkhtmltopdf

.

Instalando por compilação

.

Na minha pasta Home eu crio uma pasta chamada:

.


wkhtmltopdf

.

Na pasta Home talvez tenha que criar usando:

.


/home $ sudo mkdir wkhtmltopdf

.

Movendo o arquivo que baixei para a pasta:

.


~/Downloads $ sudo cp wkhtmltox-0.12.4.tar.bz2 /home/wkhtmltopdf

.

Descompactar o arquivo:

.


~ $ cd /home

.


/home $ cd wkhtmltopdf/

.


ls -t

.


sudo tar -jxvf wkhtmltox-0.12.4.tar.bz2

.

Se fosse arquivo .tarxz:

.


sudo tar -Jxf wkhtmltox-0.12.4_linux-generic-amd64.tar.xz

.


ls -t

.

Entro na pasta extraida do arquivo.

.


/home/wkhtmltopdf $ cd wkhtmltox-0.12.4/

.

Eu vou compilar usando estes comandos abaixo:

.


sudo scripts/build.py setup-schroot-generic

.


scripts/build.py linux-generic-amd64


.

Comandos para usar o wkhtmltopdf:

.

Para converter:

.


wkhtmltopdf http://www.site-onde-esta/o-arquivo-de/leitura.html nome-do-arquivo-de-leitura.pdf

.


wkhtmltopdf endereço.html arquivo.pdf

.

Exemplo tutorial:

.

Posso fazer o Download da web page com wget.

.


wget -p [url do download]

.

Crio uma pasta para guardar o que eu baixei.

.

Entro na pasta e uso o exemplo abaixo:

.


wkhtmltopdf [html file] [pdf file]

.

Outros...

.

A ferramenta Vilistextum converte html para texto

.


Pesquise sobre esta ferramenta.

.

Comandos do vilistextum:

.

~ $ vilistextum help
Usage: vilistextum [OPTIONS] [inputfile|-] [outputfile|-]

OPTIONS:
-a, --no-alt
-c, --convert-tags
-e, --errorlevel NUMBER
-i, --defimage STRING
-l, --links
-k, --links-inline
-m, --dont-convert-characters
-n, --no-image
-p, --palm
-r, --remove-empty-alt
-s, --shrink-lines [NUMBER]
-t, --no-title
-w, --width NUMBER

-h, --help
-v, --version
Please report bugs to <[email protected]>

.

Mais sobre conversão de arquivos de leitura:

.

Para converter de .txt ou .pdf ou .mobi ou .docx - instalo o PROGRAMA Calibre e uso via terminal:

.

EPUB > MOBI

.


ebook-convert arquivo.epub arquivo.mobi --enable-heuristics

.

TXT > DOCX


ebook-convert arquivo.txt arquivo.docx --enable-heuristics

.

PDF > EPUB


ebook-convert arquivo.pdf arquivo.epub --enable-heuristics

.

TXT > MOBI


ebook-convert arquivo.txt arquivo.mobi --enable-heuristics

.

TXT > EPUB


ebook-convert arquivo.txt arquivo.epub --enable-heuristics

.

EPUB > DOCX


ebook-convert arquivo.epub arquivo.docx --enable-heuristics

.

EPUB > PDF


ebook-convert arquivo.epub arquivo.pdf --enable-heuristics

.

MOBI > PDF


ebook-convert arquivo.mobi arquivo.pdf --enable-heuristics

.


Converter PDF para HTML:

.

Instalo o programa pdf2html.

.

Para Debian e derivados:

.


sudo apt-get install pdf2html

.

Converto o PDF em HTML

.


pdftohtml nome_do_arquivo.pdf

.

Converto o HTML em DOC / ODT


Abro o arquivo HTML no LibreOficce e salvo como texto.


.

Tem também o texi2html, gtkhtml e provavelmente muitos outros que desconheço ou que alguém está escrevendo neste mometo.

.

Eu te digo, você pode criar melhores epubs com melhores conteúdos dos que as livrarias querem te vender e a informação para criar estes epubs está disponível gratuitamente na internet. O preço você paga estudando e obtendo o poder de criar ePubs e manipular arquivos, converter arquivos, imagens, links!

.

Não pague por livros dos outros, tem muito conteúdo sem copyright na internet. Corte, recorte, remende, inverta, adicione, invente. Crie seus próprios livros!

.

Você pode fazer ePub de muitos sites e/ou páginas da internet no Linux.

Por exemplo, eu quero baixar este post e fazer dele um ePub. Como é que eu faria usando Linux?

.

$ wget http://www.tocadacoruja.net/forum/showthread.php/39290-Linux-Converter-HTML-para-PDF

.

Baixei a página em html mas provavelmente ela não tem a extensão .html então no terminal eu faço assim:

mv nome-do-que-baixei-com-wget meu-novo-arquivo.html

.

Com o Calibre instalado no meu sistema eu uso:

.

ebook-convert meu-novo-arquivo.html meu-novo-arquivo.pdf --enable-heuristics

.

ebook-convert meu-novo-arquivo.html meu-novo-arquivo.epub --enable-heuristics

.

ebook-convert meu-novo-arquivo.html meu-novo-arquivo.txt --enable-heuristics

.

ebook-convert meu-novo-arquivo.html meu-novo-arquivo.docx --enable-heuristics


.


Até Breve



.

darksidebr
06-09-2017, 12:07
Obrigado pelo post @gu1le (http://tocadacoruja.net/forum/member.php/60833-gu1le)