[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [shell-script] copiar página da web via script - questão de formataç
From: |
Elder Marco |
Subject: |
Re: [shell-script] copiar página da web via script - questão de formatação |
Date: |
Mon, 2 Aug 2010 19:47:18 -0300 |
O lynx com a opção -dump não poderia te ajudar nisso?
Em 2 de agosto de 2010 19:07, Helton Moraes <address@hidden>escreveu:
>
>
> Caros Colegas
>
> Estou precisando pescar uma grande quantidade de dados de sites de lista
> telefônica. Cada pesquisa (por especialidades médicas) retorna várias
> páginas, então pretendo automatizar essa pesca.
>
> O fato é que, se eu dou um "selecionar tudo" no Firefox, e copio/colo no
> editor de texto, obtenho algo do tipo:
>
> Ardais Clínica de Cirurgia Plástica Tel: (51) 3330-4856
> Rua Quintino Bocaiúva, 699
> Floresta - Porto Alegre - RS - CEP: 90440-051
> mapa | +info | torpedo
> Compartilhe essa informação no Facebook Compartilhe essa informação no
> Twitter
>
> Arnt, Ricardo A Tel: (51) 3346-5762
> Rua Mariante, 288 s 1007
> Rio Branco - Porto Alegre - RS - CEP: 90430-181
> mapa | +info | torpedo
> Compartilhe essa informação no Facebook Compartilhe essa informação no
> Twitter
>
> Augusto Casagrande Tel: (51) 3346-2812
> Rua Mariante, 288 s 501
> Rio Branco - Porto Alegre - RS - CEP: 90430-180
> mapa | +info | torpedo
> Compartilhe essa informação no Facebook Compartilhe essa informação no
> Twitter
>
> Azambuja, Paulo R F Tel: (51) 3328-9081
> Rua Des Espiridião L Medeiros, 81
> Três Figueiras - Porto Alegre - RS - CEP: 91330-020
> +info | torpedo
> Compartilhe essa informação no Facebook Compartilhe essa informação no
> Twitter
>
> .
> .
> .
> .
>
> mas se uso o wget, evidentemente essa formatação se perde, e os
> códigos-fonte html neste caso não têm uma estrutura boa para usar algum
> parsing.
>
> Assim, a pergunta é:
> "De que forma, ou qual programa/comando/opção eu poderia usar, via linha de
> comando, para capturar para um .txt o conteúdo da página conforme mostrado
> no navegador (o que seria equivalente a copiar e colar com o mouse)?"
>
> Desde já agradeço a atenção
>
> Helton
>
> [As partes desta mensagem que não continham texto foram removidas]
>
>
>
--
Elder Marco
GNU/Linux User: #471180
"Contra o positivismo, que pára perante os fenômenos e diz: 'Há apenas
fatos', eu digo: 'Ao contrário, fatos é o que não há; há apenas
interpretações'. "(Nietzsche)
[As partes desta mensagem que não continham texto foram removidas]