[[20140729113413]] 『web・リンク先のデータの取得』(くろたろう) ページの最後に飛ぶ

[ 初めての方へ | 一覧(最新更新順) | 全文検索 | 過去ログ ]

 

『web・リンク先のデータの取得』(くろたろう)

 質問が続いて恐縮ですが、下記なにか方法がありましたらお力添え頂けないでしょうか。

 webページ記載されているリンク先のファイルを自動で保存する、という事は可能でしょうか。

 具体的には「政府統計一覧」の下記ページの
 http://www.e-stat.go.jp/SG1/estat/GL08020103.do?_toGL08020103_&tclassID=000000030019&cycleCode=0&requestSender=search

 表番号「2」のExcelボタンから保管できるファイルを自動で取得したいです。

 全年代・全都道府県のページから落としたいのですが、
 いくつかボタンのリンク先のアドレスを調べましたが、規則性がありませんでした。
 都道府県によって用意されているファイルの種類が違う為だと思います。

 各ページのアドレスは取得したので、対象ページのn番目のリンク先を保存、もしくは取得…なんて事が出来ないかな…と。

 アドレスに規則性はありませんでしたが、ページのボタンの並びは揃ってるようなので
 タブストップのような感じで利用できる何かがないかな、と漠然と考えています。

 VBAは多少理解していますが、web関連は勉強不足です。
 キーワードをいただければ、自分でも調べますのでなにかヒントがあればお願い致します。

< 使用 Excel:Excel2010、使用 OS:Windows7 >


 提示されたurlのソースをコピーしてメモ帳に貼り付け
 上から50行くらいを削除してエクセルに貼り付け

                <a href="./GL08020103.do?_xlsDownload_&fileId=000000030478&releaseCount=2" 
        ↑こんなのがExcelファイル数だけあるのでオートフィルタなどで抽出

 http://www.e-stat.go.jp/SG1/estat
 ↑これは共通のようなので、
 /GL08020103.do?_xlsDownload_&fileId=000000030478&releaseCount=2
 & で結ぶ
 http://www.e-stat.go.jp/SG1/estat/GL08020103.do?_xlsDownload_&fileId=000000030478&releaseCount=2
 ↑これが 1 のファイルアドレスのようです

 これをファイル数だけ繰り返す

 VBAでWeb上のボタンクリックは誤動作が多いので(私がやると)、ここまでですね。

 参考に
 [三流君VBAでIE操作 InternetExplorer.Applicationを操作する]
http://www.ken3.org/cgi-bin/group/vba_ie.asp

(jun53) 2014/07/29(火) 23:21


 よく考えたらサイト上のDLボタンで開いたほうが早いですね。
 失礼いたしました。

(jun53) 2014/07/30(水) 00:09


 昔はwebページのある階層の下のリンク先一括ダウンロードするフリーソフトとかあったけど、
そーいうのじゃだめなのかな?
 ダウンローダーで検索するといろいろ出てくるけど。

 あとはFirefoxに拡張機能で昔はなんだかあった気がする(今Firefoxないので確認できない)
(1111) 2014/07/30(水) 09:03

 jun53さん、1111さんありがとうございます。

 ダウンローダーは、対象外データが大量に取れてしまうのと
 ファイルの名前が各県同一のものだったので、
 落としながらリネーム出来るVBAを検討していました。

 ですが、対象資料を見直してみたらExcelになっているのは3(年度)×47(都道府県)だけで、
 後はDB抽出していかないといけないみたいです…(こっちの方が面倒でショック…)

 今回は手動で行おうと思います。
 アイデア等ありがとうございました!
(くろたろう) 2014/07/30(水) 10:04

コメント返信:

[ 一覧(最新更新順) ]


YukiWiki 1.6.7 Copyright (C) 2000,2001 by Hiroshi Yuki. Modified by kazu.