Domanda Scansione di molte pagine direttamente in un PDF


C'è un programma facile da usare in Ubuntu che può scansionare molte pagine direttamente in un file PDF?


33
2017-10-03 08:50


origine


Mi chiedo solo, ci sono delle qualifiche speciali necessarie per scanner / stampanti che vorrei usare in Ubuntu? - JFW
@JFW, ecco un elenco di dispositivi supportati per XSane, il back-end utilizzato dalla maggior parte degli scanner di Ubuntu. Le stampanti / scanner / fotocopiatrici HP sembrano una buona scelta affidabile, se stai cercando. - poolie


risposte:


L'idea di avere una semplice utility di scansione era dietro lo sviluppo di, beh, Scansione semplice - lo strumento di scansione installato per impostazione predefinita da 10.04 in poi (Applicazioni ‣ Grafica ‣ Scansione semplice). alt text

Basta scannerizzare tutte le pagine che vuoi e scegliere PDF come formato di file durante il salvataggio.

Un altro programma leggermente meno semplice che offre funzionalità aggiuntive come il riconoscimento del testo gscan2pdf, anche nei repository. alt text


37
2017-10-03 10:10



+1 per Simple Scan: è così facile e semplice, ma anche molto potente: è particolarmente adatto al lavoro che hai menzionato. - 8128


"Facile da usare" è negli occhi dell'utente, ma xsane fornisce questa funzionalità. Scegli multipagina dove dice viewer (o premi CTRL-M), e non dovrebbe essere troppo difficile da capire da lì.


5
2017-10-03 09:40



Personalmente vedo xsane il più facile da usare ... - 8128
Ho usato xsane per tutto questo tempo. Non mi è mai venuto in mente che potrebbe esserci uno strumento migliore. - Amanda


Stavo usando xsane fino a quando non ho visto questa domanda e considerato la sua interfaccia idiosincratica a dir poco, ma efficace.

Vedendo questa domanda sono andato a cercare e ho trovato gscan2pdf vivendo nei repository di Ubuntu Lucid / Maverick. Utilizza lo stesso motore di scansione (libsane) ma l'interfaccia utente è molto più Gnome-ish. Per un buon tempo, prova:

sudo apt-get install gscan2pdf

3
2017-10-03 10:11





Cambia il nome del file da myfile.jpg a myfile.pdf nella finestra di dialogo di salvataggio di Simple Scan.

Testato su Ubuntu 14.04, Simple Scan 3.12.1.

Funziona anche se il menu a tendina del tipo di file non mostra "PDF", solo "Immagini". Lo considero un bug dell'interfaccia utente.

Questa funzione è documentata su Help > Contents:

Dalla finestra di dialogo "Salva con nome", scegli uno dei tipi di file supportati o cambia semplicemente l'estensione nel campo "Nome".

Dice che sono supportati i seguenti formati:

  • PDF
  • JPEG
  • PNG
  • TIFF

Fatto interessante: se si modifica il tipo di scansione (menu a discesa oltre a "Scansione") in "Testo", il tipo di file predefinito diventa PDF.


3
2017-08-18 10:31





Scansione di pagine da scanner USB. Usa tesseract in OCR in un PDF. Unisci più pagine in un unico PDF. Utilizzo: scan2PDF outputfilename number_of_pages

#!/bin/bash
#scan2PDF
#Requires:      tesseract 3.03 for OCR to PDF
#               scanimage for scanning, I use  1.0.24
#               pdfunite to merge multiple PDF into one, I use 0.26.5
#
#       Use scanimage -L to get a list of devices.
#       e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
#       then copy/paste genesys:libusb:006:003 into SCANNER below.
#       play with CONTRAST to get good images
DPI=300
TESS_LANG=nor  #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003  #My USB scanner
CONTRAST=35   #Contrast to remove paper look

FILENAME=$1 #Agrument 1,filename
PAGES=$2    #Argument 2, number of pages

re='^[0-9]+$'  #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
   echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi

SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp

if [ -d ${TMP_DIR} ]  #Check if it exists a directory already
then
        echo Error: The directory ${TMP_DIR} exists.
        exit 2
fi
mkdir ${TMP_DIR}  #Make and go to temp dir
cd ${TMP_DIR}

echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES}  --batch-prompt


echo Starts Tesseract OCR

for file in  *.tif  #Goes through every tif file in temp dir
do
        tesseract $file  ${file%.tif} -l ${TESS_LANG} pdf

done

if [ "$PAGES" = "1" ] #How many pages
then
    cp out1.pdf ../${FILENAME}.pdf  #Only one page, just copy the PDF back
else
        for file in *.pdf  #More pages, merge the pages into one PDF and copy back
    do
            pdfuniteargs+=${file} 
            pdfuniteargs+=" "
    done
    pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
    echo ${FILENAME}.pdf done

rm *                    #Done, clean up
cd ..
rmdir ${TMP_DIR}

0
2018-02-12 13:52