Linux/Unix Shell Scripting - Procesamiento de espacios en variables declaradas por $(comandos)

Pos: 19

Val: 15

Procesamiento de espacios en variables declaradas por $(comandos)

Publicado por Raúl (5 intervenciones) el 22/06/2018 18:03:18

Buen día a todos.

¿Saben si hay forma de que al declarar una variable como output de un comando usando este -> $(), no separe los resultados por espacio y lo haga sólo por '\n'?

Les describo brevemente mi problema, estoy tratando de ordenar un montón de PDFs recuperados por photorec usando scripts, hasta el momento he realizado ordenamiento por metadatos y titulos que no sean de la forma f{número}.{extensión de archivo}, ahora para refinar mi ordenamiento estoy procesando los PDF mediante OCR, usando ocrmypdf y pdftotext, algo como lo que sigue

#!/bin/bash/

# ------------------------------------

# Conseguimos el árbol del directorio,

# sólo sirve para archivos con nombres

# escritos sin espacios

files=$(ls | grep pdf)

declare -i counter

# Recorremos el output del comando

for file in $files

do

  # Separamos el nombre para poder crear archivos "regulares"

  name=$(echo $file | tr "." "\n")

  counter=0

  for i in $name

do

    if  [ $counter -eq 0 ]; then

      baseName=$i

    else

      extension=$i

fi

      counter=+1

  done

  scannedName="scann"$file

  textName=$basename".txt"

  # Ahora procesamos OCR

  ocrmypdf $file $scannedName

  # Si el PDF ya es OCR entonnces no existe

  # mi archivo, y proceso para TXT al original

  if ls $scannedName; then

    pdftotext $scannedName $textName

  else

    pdftotext $file $textName

fi

La cosa es que

$(command)

separa las palabras por espacios, y en caso de archivos que sean del tipo "este es mi archivo.pdf" tengo una variable por palabra en vez de una por archivo

# Input:

# archivo1.pdf

# archivo2.pdf

# archivo3.pdf

# mi archivo 4.pdf

files=$(ls | grep pdf)

#output:

# archivo1.pdf

# archivo2.pdf

# archivo3.pdf

# mi

# archivo

# 4.pdf

Y no se me ocurre alguna forma de procesar de manera adecuada esos archivos. Espero me puedan dar algunos indicios para resolver mi problema, igual sigo googleando.

Saludos

PD Se que mi redacción para el final es redundante, me disculpo por ello

Valora esta pregunta

Me gusta: Está pregunta es útil y esta clara

No me gusta: Está pregunta no esta clara o no es útil

Responder

Pos: 5

Val: 66

Procesamiento de espacios en variables declaradas por $(comandos)

Publicado por kip (17 intervenciones) el 22/06/2018 18:58:49

Hola, es una mala practica listar los archivos de la forma en la que lo haces, una alternativa podría ser esta:

for file in *pdf*; do

    echo "$file"

done

Lo anterior te servira si ejecutas el archivo sobre el path donde están los archivos pdf.

Quizás eso resuelva el problema que mencionas, inténtalo y si te falla una parte siguiente del código avísanos.

Por cierto te recomiendo usa la interpolación para concatenar cadenas, es mucho mas intuitivo y fácil de leer:

textName="${basename}.txt"

Valora esta respuesta

Me gusta: Está respuesta es útil y esta clara

No me gusta: Está respuesta no esta clara o no es útil

Comentar

Pos: 19

Val: 15

Procesamiento de espacios en variables declaradas por $(comandos)

Publicado por Jatib (5 intervenciones) el 22/06/2018 23:29:45

Muchas gracias, funcionó excelente, logró mover todo mi directorio de prueba excepto 1 archivo, porque pese a que le ponga comillas interpreta el "-" como opción de mv, sólo lo omitiré del parssing para que a nada se le ocurra empezar con ese carácter:

mv "-archivo de prueba.pdf" /destino/

mv: opción incorrecta -- «I»

Pruebe 'mv --help' para más información.

Por cierto ¿algún documento (libro, web) que me puedas referir para buenas prácticas de scripting en shell?

Valora esta respuesta

Comentar

Procesamiento de espacios en variables declaradas por $(comandos)

Publicado por Tom (361 intervenciones) el 23/06/2018 09:51:38

La mejor forma para manejar ese fichero que comienza por '-' es añadirle el path:

rm "./-archivo de prueba.pdf"

Valora esta respuesta

Comentar

Pos: 24

Val: 12

Procesamiento de espacios en variables declaradas por $(comandos)

Publicado por Santi (5 intervenciones) el 08/10/2018 17:15:05

Saludos,
Modifica la variable separadora de campos al inicio del comando:

oldIFS=$IFS
IFS=$'\n'

------Aquí los comandos que quieras...

IFS=$old_IFS

Valora esta respuesta

Comentar

Como escribir/editar código en una determinada linea de un archivo ya existente

Cómo hacer para que imprima o muestre un $ en una línea de texto ?