FC2ブログ

チラシの裏

 

--.--.--[--] スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
    --:--  Top

2009.09.17[木] How to 団体戦 2回目

いきなり飛びますが、データのダウンロードから。
ウィキにある通り、まずスレにこれからエントリー表の作成に入るということを書きます。
次にCHPJupiterSearchを使って適当なページ数を取得します。1ページ10ファイルなので15ページも取得すれば十分でしょう。取得したらコメントに"団体戦"を含むファイルを抽出します。告知の通り"■第X回団体戦"で抽出してもいいのですが、団体戦とだけ書かれる方もいるのでこちらを推奨します。
抽出したらアップロードされた順に、つまり下からダウンロードしていきます。後のことを考えると10ファイルごとぐらいでフォルダ分けすることをお勧めします。こんな感じ↓フォルダ
ダウンロード中に同じファイルが連続してあったら、ページ取得中にファイルの修正が入ったということなので取得しなおします。

データのダウンロードが終了したらそれぞれのフォルダで更新日時昇順でソートします。
更新日時昇順でソート

更新日時=ダウンロード日時なので、これでダウンロード順(=エントリー順)にソートできます。ダウンロード中に何らかのアクシデントがあった場合は手作業でエントリー順に並び替えてください。
これがすんだらCHPJupiterSearchでページを取得しなおします。取得が終了したら下から1ファイルずつファイル名を突き合わせて、ダウンロード漏れがないか、順番はあっているかを確認します。もちろん駆け込みのエントリーも確認します。

これが終了したらエントリーデータの作成に入ります。ここではCHXを使った方法を紹介します。
まずCarListのロングモードで適当に全体の様子をながめます。
01-30
No1~30のチームです。シルバー・ライオットさんのファイルに余分なチームが入っているのがわかります。浸透襲撃さんのファイルにも空チームが入っていますが、CHXは空チームを認識しないので問題ありません。
31-50
No31~50のチームです。DM3さんのファイルには3機入ったチームが入っていることがわかります。こういった例外的処理を行わなければならないチームのことを頭の片隅に入れておきましょう。

ざっと把握したらCHXにCHPファイルを取り込ませます。ソートした状態ですべて選択し、D&Dすればその並び順を保ったまま読んでくれます。しかし一応確認しておきましょう。CarListで確認した余分なチームは削除します。

CHX1
すべてのチームを選択し、ファイル名、チーム名、オーナー名、機体名称を表示させた状態ですべて選択しコピーします。
テキストエディタ(ここではEmEditorですが、メモ帳でも出来ます。が、後のことを考えれば多機能なテキストエディタがあったほうがいいです。)にペーストし、半角スペースをタブに置換。タブはコピペで持ってくるか、正規表現をオンにして\t

置換前
置換前
置換後
置換後

ここで押さえておくべきことはチーム名、オーナー名、機体名称に使われる文字はすべて全角ということです。つまりこれ以降もデータ同士の区切りを半角スペースとすることで、チーム名などに含まれる全角スペースと区別できます。

置換したら表計算ソフトへコピペします。以降エクセルで説明します。
ペーストしたらまずNoが入っている列(普通はA列)を選択し、書式設定→ユーザー定義から表示形式を00にします。
00と入力する←00と入力
これで、1,2,3から01,02,03という表示に変わります。

表示形式を変更したら不要な列("("が入っている列など)を削除し、並び順も都合がいいように変更します。
前before
後after

ここまで終わったら希望位置の収集をします。
まず、スレから■第X回団体戦でレスを抽出します。
レス抽出

抽出したらテキストエディタにコピペし、適当な名前を付けて保存してください。
このテキストファイルに対して、あらかじめ保存しておいた計画に沿って段階的置換を自動で行ってくれる「Repl-Ace」のようなソフトで複数の置換を行います。Repl-Aceを使用する場合、Microsoft .NET Frameworkを使用することでUnicodeに完全対応した「Repl-Ace on .NET」もありますが、Unicodeは使わないので動作が軽い旧型のほうがお薦めです。
まず、正規表現をオンにして"■.*?\r\n\S*?:(半角スペース)*"と"■.*?\r\n\S*?:(全角スペース)*"を""に置換(つまり削除)します。次に"\r\n\S*?:(半角スペース)*"と"\r\n\S*?:(全角スペース)*"を"\t"に置換します。置換が完了したらgrepperなどでタブを含む行を抽出します。

抽出が完了したら先ほどの表計算ソフトに数列開けてコピペします。ペーストしたらVLOOKUP関数を使いCHXからの出力に合わせます。

VLOOKUPで検索したところ
ここまで終えるとこんな感じです。左がCHXからのデータ、右がスレからのデータです。エラーが出ているのはスレでエントリー表明をしてない方か、書式がこちらの想定した通りではなかった方です。

とりあえずここまで。
次は置換する際の正規表現の説明からの予定
Comment







(編集・削除用)


管理者にだけ表示を許可
Trackback
http://98998.blog65.fc2.com/tb.php/45-4c2440ec
Pagetop
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。