Cum se convertește o pagină web într-un fișier PDF sau imagini în Linux

Cum se convertește o pagină web într-un fișier PDF sau imagini în Linux

Doriți să știți cum puteți captura o pagină web și o puteți salva ca document PDF sau imagine utilizând terminalul? Din fericire, Linux are o mulțime de utilități pe care le puteți utiliza pentru a automatiza sarcina de a converti documente HTML în fișiere PDF și imagini.





Acest articol vă va prezenta wkhtmltopdf și wkhtmltoimage, utilități de care aveți nevoie pentru a vă ușura munca.





Cum se convertește HTML în PDF

Dacă doriți să capturați pagini web și să le convertiți într-un fișier PDF, utilitarul wkhtmltopdf vă va ajuta. Wkhtmltopdf este un instrument de linie de comandă open-source utilizat pentru redarea paginilor web în documente PDF.





Deoarece instrumentul funcționează fără cap în interiorul terminalului Linux, nu veți avea nevoie de niciun driver web sau un cadru de automatizare a browserului precum Selenium.

Instalați wkhtmltopdf pe Linux

Wkhtmltopdf nu este unul dintre pachetele standard care sunt preinstalate pe Linux. Va trebui să-l instalați manual folosind managerul de pachete al sistemului.



Pentru a instala wkhtmltopdf pe distribuțiile bazate pe Ubuntu și Debian:

sudo apt install wkhtmltopdf

Pe distribuțiile bazate pe Arch, cum ar fi Manjaro Linux:





sudo pacman -S wkhtmltopdf

Instalarea wkhtmltopdf pe distribuții bazate pe RHEL, cum ar fi Fedora și CentOS, este de asemenea ușoară.

sudo dnf install wkhtmltopdf

Sintaxa de bază

Sintaxa de bază a comenzii este:





wkhtmltopdf webpage filename

...Unde pagină web este adresa URL a paginii web pe care doriți să o convertiți și nume de fișier este numele fișierului PDF de ieșire.

Pentru a converti pagina de pornire Google într-un document PDF:

wkhtmltopdf https://google.com google.pdf

Ieșire:

La deschiderea fișierului PDF, veți observa că wkhtmltopdf a redat cu exactitate pagina web într-un document.

The --copii flag este un salvator dacă doriți ca fișierul dvs. de ieșire să aibă mai multe copii ale paginii web. Rețineți că atunci când tipăriți mai multe copii, wkhtmltopdf nu va genera mai multe fișiere PDF, ci va adăuga în schimb pagini suplimentare la un singur document.

Pentru a crea trei copii ale paginii de pornire Google:

wkhtmltopdf --copies 3 https://google.com google.pdf

Fișierul PDF de ieșire va conține trei pagini, după cum se specifică în comanda menționată mai sus.

Adăugați un filtru în tonuri de gri la ieșire

Pentru a adăuga un filtru în tonuri de gri în fișierul PDF, utilizați fișierul -g sau --scara tonurilor de gri semnalizați cu comanda:

wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf --grayscale https://google.com google.pdf

Fisier de iesire:

Schimbați orientarea PDF-ului

În mod implicit, wkhtmltopdf generează fișierul PDF în aspect vertical, adică portret. Pentru a schimba acest comportament implicit și a captura pagini web în peisaj, utilizați în schimb --orientare semnalizați cu comanda:

wkhtmltopdf --orientation landscape https://google.com google.pdf

Ieșire:

Rețineți că versiunea peisaj a documentului are o zonă mai mare în spațiu alb în comparație cu cea portretă.

Nu includeți imagini în timpul conversiei

În timp ce generați ieșirea, dacă nu doriți ca wkhtmltopdf să redea imagini prezente într-o pagină web, utilizați --no-imagini steag:

wkhtmltopdf --no-images https://google.com google.pdf

Ieșire:

Legate de: Cele mai bune instrumente pentru a edita un fișier PDF oriunde

Cum se convertește o pagină web în imagini

Utilitarul wkhtmltoimage face parte din pachetul wkhtmltopdf. Dacă lucrați la un raport și doriți să includeți imagini ale unui site web, atunci acest instrument va funcționa în favoarea dvs. Terminalul Linux nu numai că vă facilitează captarea imaginilor, dar vă oferă și o gamă de opțiuni care vă permit să vă personalizați ieșirea.

cel mai bun manager de fișiere pentru Windows 10

Sintaxa de bază

Wkhtmltoimage are o sintaxă similară cu wkhtmltopdf:

wkhtmltoimage webpage filename

...Unde pagină web este adresa URL a unui site web și nume de fișier este numele imaginii de ieșire.

Convertiți o pagină Web într-o imagine

Continuând cu exemplul menționat mai sus, să convertim pagina de pornire Google în imagini.

wkhtmltoimage https://google.com google.png

Ieșire:

De asemenea, puteți specifica un format de fișier personalizat pe care doriți să îl aibă imaginea de ieșire. Wkhtmltoimage acceptă următoarele extensii de fișiere:

  • JPEG / JPG
  • PNG
  • SVG

De exemplu, dacă doriți să generați o imagine JPG, pur și simplu înlocuiți extensia de fișier cu JPG în comandă:

wkhtmltoimage https://google.com google.jpg

Legate de: JPG vs. JPEG: Care este diferența dintre aceste formate de fișiere imagine?

Capturarea paginilor web utilizând terminalul Linux

Dacă doriți să vizualizați fișierele PDF generate de wkhtmltopdf, trebuie să aveți un vizualizator PDF instalat pe sistemul Linux. În timp ce majoritatea distribuțiilor Linux vin cu un editor PDF preinstalat, puteți alege și instala manual un editor PDF care se potrivește nevoilor dvs.

Acțiune Acțiune Tweet E-mail Cei mai buni 5 editori Linux PDF pe care ar trebui să-i încercați

Aveți nevoie să editați un fișier PDF în Linux? Aceste editoare de PDF-uri Linux sunt gratuite de instalat și ușor de utilizat.

Citiți în continuare
Subiecte asemănătoare
  • Linux
  • PDF
  • Linux
Despre autor Deepesh Sharma(79 articole publicate)

Deepesh este Junior Editor pentru Linux la MUO. El scrie ghiduri informaționale pe Linux, cu scopul de a oferi o experiență fericită tuturor noilor veniți. Nu sunt sigur de filme, dar dacă vrei să vorbești despre tehnologie, el este tipul tău. În timpul liber, îl poți găsi citind cărți, ascultând diferite genuri muzicale sau cântând la chitară.

Mai multe de la Deepesh Sharma

Aboneaza-te la newsletter-ul nostru

Alăturați-vă newsletter-ului pentru sfaturi tehnice, recenzii, cărți electronice gratuite și oferte exclusive!

Faceți clic aici pentru a vă abona