2012/12/31

NeuronDoubler紹介映像を作成

動画制作の練習がてらNeuronDoublerの紹介動画を作成してみました。
内容はこれまでの開発結果のまとめとニューラルネットワークの学習過程での出力変化の映像等。
3分程度の尺に綺麗に押し込むのは難しいです。



動画はニコニコ動画にアップロード。いつの間にか一般会員でも1280x720まで投稿できるようになっています。
投稿動画は解像度が必要かつほぼスライドショー形式なので720pで作成しビットレート削減の為10fpsにしてみました。

余談ですが、現行仕様でのDbD表示に拘るよりも今後のプレイヤーのサイズ仕様変更を考えてビットレートと容量の許す範囲で大きめの解像度で作成しておくのが良さそうです。
しかしビットレート制限が厳しいので普通の動画だと960x540や640x360あたりが限界かと思います。

2012/12/26

NeuronDoubler v3.10の超解像サンプル画像とLanczos-3、Bicubic、100x100倍 超解像ソフトとの画質評価

この記事は古いので、
MSE・PSNRによる画像拡大アルゴリズム10種・ソフト8種、計14パターンの画質評価結果
も合わせて見て下さい。

NeuronDoublerがv3.10になって画質が向上したので前回のPSNRによる画質テストに続き、拡大結果の比較用に計4種類のソフトウェア及びアルゴリズムでの超解像サンプル(縦横4倍の画素数16倍拡大)を作成しました。

本記事のテスト画像は、引用元(http://loggialogic.blogspot.com/)の記載があれば転載可能です。画像は全て私(Wirewriggle)が作成又は撮影した物を使用しています。

テスト結果

まずはNeuronDoublerとLanczos-3の比較用に抜粋した結果です。ロスレスのPNG-24形式です。
*画像をクリックすると大きく表示されます。

超解像処理テスト抜粋結果1
 超解像処理テスト抜粋結果2 
 超解像処理テスト抜粋結果3 

全ての結果を纏めた画像を掲載します。品質80のJPEG形式で不可逆圧縮されています。

2012/12/20

PSNRによる画像拡大アルゴリズム7種の画質評価結果

この記事は古いので、
MSE・PSNRによる画像拡大アルゴリズム10種・ソフト8種、計14パターンの画質評価結果
を見て下さい。

各種画像拡大アルゴリズムとソフトウェアの紹介

評価に使用した超解像・画像拡大アルゴリズムの紹介です。Photoshop以外は無料で入手して使用できる物です。


人工知能超解像プログラム NeuronDoubler

当方の開発した超解像を行うフリーソフトウェアです。ニューラルネットワークを応用した独自アルゴリズム(連想記憶型人工知能による一種のデータベース型超解像)で動作します。
使用ソフト/設定:NeuronDoubler v3.10 / デフォルト設定


「100x100倍 超解像ソフト」

神戸大学の研究室が公開している超解像ソフト。データベース型超解像と思われます。
使用ソフト/設定:100x100倍 超解像ソフト Windows用 Version 2012.06.04 / デフォルト設定


「Lanczos-3(ランチョス3)」

高品質で有名な画像の拡大/縮小アルゴリズムです。実装しているソフトウェアは少なめです。
使用ソフト/設定:藤 -Resizer- v2.63.0 / Lanczos-3


「Bicubic(バイキュービック)」

下記のバイリニアと合わせ、一般的に普及している拡大アルゴリズム。
使用ソフト/設定:Photoshop CS5 / バイキュービック法 - 滑らか(拡大に最適)


「Bilinear(バイリニア)」
単純な線形補間による拡大アルゴリズム。
使用ソフト/設定:Photoshop CS5 / バイリニア


「Nearest neighbor(ニアレストネイバー)」

最も単純な拡大アルゴリズム。整数倍の拡大では元画像がそのまま引き延ばされます。
使用ソフト/設定:Photoshop CS5 / ニアレストネイバー


「SmillaEnlarger」

有名なオープンソースの画像拡大ソフト。アルゴリズムは独自のようです。
使用ソフト/設定:SmillaEnlarger version 0.9.0 / デフォルト設定


人工知能超解像プログラム NeuronDoubler v3.10公開

v3.11を公開したのでそちらをご利用下さい。

人工知能超解像プログラム NeuronDoublerのv3.10を公開しました。
画質の向上がメインです。

NeuronDoubler v3.10

主な変更点(v3.05->3.10)

・超解像処理の画質を向上
・若干の処理速度向上
・ニューラルネットワークのデータサイズを数十MB削減
・使用メモリ量を数十MB削減
・PSNRだけ稼ぐ機能を廃止
・その他内部的な細かい最適化と改良

画質の向上について

学習エンジンの改良によるニューラルネットワークモデルの性能向上と固定ロジックの調整により画質が改善しました。

2012/12/13

WiiUとZombiUを購入したのでレビューしてみる

WiiUハードウェアレビュー

WiiUの目玉機能のゲームパッド。
WiiU(プレミアムセット)とゾンビU(UBISOFT)を購入したのでレビューしてみます。

プレミアムセットのメリット(ベーシックセット比)

・色が黒(ベーシックは白)
・本体容量が32GB(ベーシックは8GB)
・ゲームパッド充電スタンド付属
携帯電話の充電クレードルに近いです。位置決めし易いようにパッドを受ける部分にローラーが付いています。

・ゲームパッドプレイスタンド付属
何の変哲もないプラ製スタンド。

2012/11/18

HP EliteBook 2760p Tablet PC用に小型BluetoothキーボードTK-FBP013BK購入とコンパクトキーボード雑感


EliteBook 2760p Tablet PC + TK-FBP013BK

EliteBook 2760p Tablet PCのハードウェアキーが足りない

Windows7搭載コンバーチブル型タブレットPC、2760pを購入してから半年ぐらいが経過しました。

関連記事:
HP EliteBook 2760p Tablet PCを格安で購入できた
HP EliteBook 2760p Tablet PC (A2N94PA#ABJ)に64bitOS導入とメモリ増設ほか
HP EliteBook 2760p Tablet PCをSSDに換装した

この2760p、液晶電磁誘導ペンタブレットとして作業する場合は、本体を安定させる為に画面を裏返してタブレット形態にして使うのですが、この状態ではキーボードは使用できません。

タブレット形態でも、ちょっとした文字の入力ならソフトウェアキーボードを表示してペンや指で入力すれば事足ります。
しかしIllustStudioやPhotoshopを使用する際には、やはりキーボードがないとショートカットキーの入力が出来ないので不便です。
この辺でWindows用のアプリをタブレットスタイルで使用する限界を感じます。

2012/11/16

シムシティ(5)を推奨スペックも分からないまま予約購入してしまった

シムシティを予約

シムシティ4から10年ものブランクを経て、ついにマクシス開発のシムシティ新作(シムシティ5)が登場します。今回はタイトルにはナンバリングが付かず「シムシティ」となっています。
シムシティは3000SE,4DXと遊んできたので5作目の発売日が決定するのを楽しみに待っていたせいもあり、予約開始早々反射的に予約しました。



ちなみに発売日は大分先で2013年の3月7日です。
今回は初回特典があり、また珍しくAmazonが特典の面で優遇されているようで通常の初回特典に加えて「都市セット(フランス)」が付きます。都市セットとは何なのか詳細は不明ですが、フランスの町並みを再現する為の公式MODパックのようなものだと思います。そのうちDLコンテンツとして他の都市セットも追加されるのでしょうか。

また時代の流れでパッケージ版に加えてダウンロード版もありますが、古い人間なのでパッケージ版を選択しました。

シムシティとは

2012/11/10

NEX-5N用に対角線魚眼レンズVCL-ECF1を購入

SONYから像面位相差AFを搭載したNEX-6とNEX-5Rが発表されましたが、流石にNEX-5Nから買い換える訳にも行きません。とりあえず物欲を抑える為にフィッシュアイコンバーター(VCL-ECF1)を購入し浪費を5万円も抑えました。

VCL-ECF1

このVCL-ECF1はE16mm F2.8(SEL16F28)専用コンバータで、以前購入したVCL-ECU1(ワイコン)の姉妹製品にあたります。装着するとF2.8のまま10mm(35mm換算で15mm)の対角線魚眼レンズになります。
また、最短撮影距離が(撮像面からの距離で)0.24mから0.13mに短縮されます。
ちなみにマニュアルはウルトラワイドコンバーター(VCL-ECU1)と共通でした。

外観と簡易レビュー

2012/11/04

L字テロップを自動検出する方法を考える

・L字テロップが多い

最近の番組は結構な頻度でL字テロップが入ります。そこでL字テロップを自動検出出来ないか考えてみる事にしました。

そのテロップ、本当に必要ですか?

・パターン認識で検出出来ないか考える

L字テロップは局や番組によってL字の向き・背景色・幅・表示内容の動静もまちまちです。
さらにコの字テロップやコの字ワイプテロップ(一部が半透明で映像部分に被る)も存在し、加えてテロップが2重3重の入れ子になる場合もあるようです。
これをまともに認識させるのは難易度が高そうなので没案に。認識出来ても劇中劇のような演出で枠が付いていると誤動作しそうです。

・ロゴ検出(logoGuillo)を利用してL字テロップを検出する

と言う訳で、安直な方法ですが現行技術の延長で解決を図ります。

2012/10/29

USB3.0拡張カードリソース問題解決+μPD720200のドライバとファームウェアについて

大分前に購入したUSB3.0インターフェースカード(AREA PEU3N-2EL)が「このデバイスが使用できる空きリソースが不足しています。 (コード 12)」のエラーが出て動作せず放置していたのですが、レジストリを変更するだけで動作するようになりました。

対策としては
マイクロソフト:Windows Vista または Windows Server 2008 を実行しているコンピュータに PCI Express 拡張シャーシを接続すると、エラー メッセージ "コード 12" または "コード 31" が表示される
の記述通りに
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\PnP\Pci
に32bitDWORDなレジストリキー"HackFlags"を作成し、以下の値を指定します。

・コード12:PCI Expressブリッジデバイスの列挙失敗の回避策は400(16進)
・コード31:PCIバス番号不足の回避策は200(16進)
・上記二種類の回避策を同時に使用するには600(16進)

当方の環境ではコード12でのエラーが出ていたので素直に400を指定し無事動作しました。
USB3.0ホストが正常認識された


ついでにUSB3.0ホストコントローラ(μPD720200)のドライバとファームウェアの話を載せておきます。

2012/09/23

著作権法改正案の施行に伴う当サイトの対応について

*当記事には法律に関する記載がありますが、当方は専門家ではない為誤認識や推測が含まれる場合があります。

2012年10月1日より著作権法の一部を改正する法律の下記項目が施行されるようです。
・公文書管理法等に基づく利用に係る規定の整備
・技術的保護手段に係る規定の整備並びに違法ダウンロードの刑事罰化に係る規定の整備(の一部)

参考:平成24年通常国会 著作権法改正について(文化庁)

PCでの録画に関する技術や開発には以下の項目が関係していると思われます。
・技術の開発又は実用化のための試験の用に供するための利用
・著作権等の技術的保護手段に係る規定の整備

しかし一体何が違法で何が合法なのかは私には判別できませんでした。とはいえ何もしない訳にはいきませんのでLoggia Logic(当サイト)においては以下の対応を行いました。
・一部ソフトウェアに関する記述の削除
・一部表現の修正及び削除

*一般的な技術であるMPEG2/H264の動画処理やロゴ認識等の画像処理、BATコマンドのTips、ファイル名の成形等に関する記事や記載は残してあります。

また上記対応に加えて当方の開発環境でも9月末より大幅に縮退運転及び使用中止をする事にしました。つきましては下記内容に関する問題や不具合、Out of date等の対応は基本的に行えませんのでご了承ください。
ロゴ検出型自動CMカットプログラム logoGuillo
setTsTitle(TSファイル名の成形)
・その他一部の記事

上記法律の内容及び影響範囲が認識できない為に過剰な対応を行っている部分もあるとは思いますが、公序良俗と法を遵守し常に安全側に行動する為ですのでご了承下さい。
本件に関しまして未だ対応不十分な点などが御座いましたら、御手数ですがご指摘頂ければ幸いです。

Wirewriggle

2012/09/18

pixyBlockマニュアル(導入&使用方法)

pixyBlockのWindows環境用マニュアルです。(v1.10用、2012/09/18更新)

pixyBlock

pixyBlockとは

pixyBlockはOperaのコンテンツブロック用のURLフィルタリング機能を利用して、pixiv(イラスト投稿系SNS)で特定ユーザーのサムネイル画像が表示されないようにするフリーソフトウェアです。
スクリプトとして動作するタイプではなく、Opera標準搭載のURLフィルタリング機能を使用するので軽いと思います。

pixivのユーザー数は非常に多いのですが、興味深い事にランキングや特定タグでサムネイルを非表示にしたいユーザーは大抵同じ人なのである程度の人数をブロックするだけでも大分効果があります。

処理内容

Operaでpixivのとあるユーザー(baduser)のサムネイル表示(の一つ)をブロックすると以下のようなURLがurlfilter.iniの[exclude]に追加されます。

http://i0.pixiv.net/img00/img/baduser/00000000_s.jpg=UUID:xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

pixyBlockはこのURLを成形して以下のようにする事で、指定したユーザ(baduser)のサムネイル全てが表示されないようにしています。

http://*.pixiv.net/*img/baduser/*

*pixyBlock側の仕様上ではurlfilter.iniは数十万行まで対応しています。

2012/09/16

エンコード終了後に休止状態に入るか選んでから処理するBAT

エンコードに限った話ではないのですが、PCで時間の掛かる処理をBAT処理する事はよくあります。
さらに処理が完了したら自動的に休止状態に移行してくれると気軽に無人稼働出来て便利です。
しかし別作業をしながらバックグラウンドで処理する場合等、毎回休止状態に入られると都合の悪い事もあります。

という訳で始めに休止状態に入るか選択してから処理を行うBATの紹介です。
最近は電気代も高いので夏は外出中、冬は就寝中に100GFLOPSの暖房器具を稼働する事で節電できます。

BATの処理内容

1.BATを実行
2.処理完了後に休止状態に入るか選択(Yes/No)する
3.処理が実行される
4.最初にYを選択した場合は休止状態に移行する

サンプルコード

エンコード関連記事一覧

著作権法改正案の施行に伴う当サイトの対応について

エンコード関連の記事が増えた為、インデックスページを作成しました。
2012/09/16までに投稿した各記事へのリンクを纏めてあります。

*下記ソフトウェアに関する記事は以下のリンクから辿って下さい。
ロゴ検出型自動CMカットプログラム logoGuillo
setTsTitle(TSファイル名の成形)

エンコード関連記事一覧

2012/09/15

現在運用中のx264オプション

現在運用中のエンコード環境でのx264オプションに関する記事です。

前提条件と仕様

・AVSは以前の記事に掲載した物と組み合わせて使用しています。
*別記事:現在運用中のAvisynth Scriptのマスタ

・アニメ用(実写は縮みにくく時間が掛かるのでエンコードしません)
*別記事:MPEG2を再エンコードせずにCMスキップ用チャプター&字幕付の(m2v+aac).mp4を作成する

・24fps(24000/1001 fps) CFR

・x264のバージョンはr2085 64bitを使用(しばらく更新していないので古いです)

・ハードウェア環境
CPU:Intel Core i7-860
MEM:DDR3-1333 12GB
GPU:AMD Radeon HD5850 x2

x264オプション(ソース別の設定)
*解像度・ピクセルアスペクト、fps、最大ビットレートの制限設定
*別記事:x264でビットレートを制限するメリット

【1440x1080 24fps 16:9 (地上波)】
--vbv-maxrate 17254 --vbv-bufsize 17254
--input-res 1440x1080 --sar 4:3 --fps 23.976025

【1920x1080 24fps 16:9 (BS)】
--vbv-maxrate 24576 --vbv-bufsize 24576
--input-res 1920x1080 --sar 1:1 --fps 23.976025

【1920x1080 24fps 16:9 (BS11)】
--vbv-maxrate 18432 --vbv-bufsize 18432
--input-res 1920x1080 --sar 1:1 --fps 23.976025

x264オプション(共通の設定)
*画質の設定、キーフレーム挿入頻度、マルチスレッド関係等

2012/09/11

人工知能超解像プログラム NeuronDoubler v3.05公開

v3.10を公開したのでそちらをご利用下さい。

人工知能超解像プログラム NeuronDoublerのv3.05を公開しました。
バージョンはマイナーチェンジですが、画質とパフォーマンスがかなり向上しました。

NeuronDoubler v3.05

主な変更点(v3.03->3.05)

・学習エンジンの改良等により超解像処理の画質を向上
・各種最適化により最大で40%の処理速度向上
・メモリ管理を改善し使用メモリ量を最大数百MB削減

・ニューラルネットワークのデータサイズを若干削減
・32bit環境での動作性向上
・空きメモリの動作環境を1GB->512MBに変更
・平坦部の拡大アルゴリズムをバイキュービック法からLanczos3に変更
・縮小処理アルゴリズムを平均画素法からLanczos3に変更
・PSNRだけ稼ぐ機能を追加
・その他内部的な細かい最適化と改良

画質の向上について

2012/09/09

並列処理を行うBATでエンコードやCMカットを高速化する

はじめに

エンコード等の処理を高速化する手段としてはマルチスレッド化が一般的だと思います。

しかしAvisynthでのフィルタ処理をMT等でマルチスレッド化してもそれほど効果がない場合も多く、またx264はスレッド数を増やすと(僅かですが)ファイルサイズが増加したり画質が低下したりします。
デュアルコアの時代は簡単にCPUを使い切る事ができましたが、最近のCPUでは8スレッドや12スレッドを実行できるのでスレッドを埋めるだけでも大変です。

そこで、古典的ですがメモリやHDD等のリソースの限り何本も同時に処理する事で高速化を図ります。一本あたりのスレッド数を極端に増やす必要がないので効率が良いです。またlogoGuillo等のシングルスレッドアプリも高速化します。
では以下にBATの機能とサンプルを記載します。

主な機能と処理内容

・指定本数(2本以上)毎にペアを作成し並列エンコードする
・m2vファイルを探し、bat,aac,CMカットファイル(txt)があるか確認
・既にmp4ファイルやlogが生成されている場合は処理しない
・フォルダ名に"noenc"が含まれるディレクトリは処理しない

以下のように処理する動画毎にBATファイルが生成されている状態を想定しています。
*私の環境ではマスタBATとAVSを動画毎に自動コピーして処理しています。

・動画A.m2v
・動画A.bat
・動画B.m2v
・動画B.bat

このBATをn本ずつ纏めてパイプで繋いで実行することで並列処理します。

(call 動画A.bat) | (call 動画B.bat)

片方が早く終わるとパイプが存在しないとの警告が出ますが、今のところ100本以上処理した中では正常に動作しています。
また、組み合わせる動画の長さに差があると効率が落ちますが、ファイル名順に処理する場合は大抵同じ番組でペアが生成されるので問題ないと思います。

サンプルBATコード

2012/08/12

NeuronDoublerの超解像サンプル画像(x4倍)とSmillaEnlargerとの画質評価

NeuronDoublerの画像拡大処理の画質を検証する為に4倍拡大画像を作成しました。
また、比較用にSmillaEnlargerで同一倍率で拡大した画像と並べてあります。

v3.05で画質が更に向上しました。(2012/09/11)
v3.10で画質が更に向上しました。(2012/12/20)
v3.10でのサンプル画像の記事


サンプル画像

[テスト画像1] *ゆんフリー写真素材集の画像を使用
 [テスト画像2]  *ゆんフリー写真素材集の画像を使用

その他のトリミング前の画像等はGoogleドキュメントに置いておきます。

NeuronDoubler_v303_TestSample.zip (53.2MB)

人工知能超解像プログラム NeuronDoubler v3.03公開

v3.05を公開しましたのでこちらを使用してください。(2012/09/11)

人工知能超解像プログラム NeuronDoublerのv3.03を公開しました。
主にメモリ管理の改善とマイナーバグの修正です。

Java仮想マシン(JVM)に1.5GBの最大ヒープメモリサイズを設定した状態で、
解像度648x906から2592x3624への拡大(縦横4倍の16倍ズーム、60万画素→940万画素相当)
を行った結果、JVM使用メモリ約1.2GB(うち690MBをNeuronDoubler使用)となりました。
これで32bit環境でも殆ど動作するようになったかと思います。

主な変更点(v3.02->3.03)
・ニューラルネットワークのデータサイズ削減(192MB -> 96MB)
・メモリ使用量を500MB程度削減した
・メモリ使用量減少に伴い処理速度が若干向上
・"Reducing memory use"オプション廃止
・空きメモリの推奨環境を2GB->1GBに変更
・32bit環境での動作性向上
・処理が進まない場合に警告を出すようにした
・サイズ指定拡大時に2^n倍のピクセル数を指定されると余計なリサンプル処理が入る問題を修正
・デフォルトの保存形式をBMPからPNGに変更
・起動用のBATの修正
・その他内部のコードの整理

入手先&ダウンロード

Google ドキュメントに置いておきます。

リンク先の[ダウンロード]ボタン又は左上のボタンのFile->Downloadを選択してください。

ファイルサイズが大きいのでウイルススキャンの上限サイズ関係の下記メッセージが出ますが、
>Sorry, we are unable to scan this file for viruses.
>The file exceeds the maximum size that we scan.

"Download anyway"をクリックしてダウンロードして下さい。

NeuronDoubler_v303_full.zip (93.6MB)

2012/08/02

CyberPower Backup CR 1200 (CP1200SW JP)レビュー&複数台のPCでUPSを使用する方法

CyberPower Backup CR 1200 (CP1200SW JP)を購入

1年以上前の事ですが、 CyberPower 社製のUPS( Backup CR 1200 ,CP1200SW JP)を購入しました。
当時は東日本大震災後に原子力発電所が停止した事で発電能力が不足し、計画停電が実施される事態となっていました。
開閉器が多々稼働する中、瞬停が発生すると困るので日中はPCを休止状態で稼働していましたが、日に何度も復帰と休止を行き来するのは精神衛生上良くないのでUPSを購入する事にしました。


CyberPower Backup CR 1200 (CP1200SW JP)の概要



・PCに利用可能な正弦波出力(PFC電源対応)
・1200VA / 720Wの大出力
・12V 8.5AH (エンコ中350W使用でも12分以上稼働)
・自動電圧調整器(AVR)
・YUASAバッテリ(NPW45-12)
・APCの製品等と比較して安い(当時は特需の為UPSが高額でした)
・台湾メーカー
・消費電力、残り時間等のLCD表示
・Windows/Linux/Mac OS X
*同型筐体の廉価版で900VA / 540WのBackup CR 900(CP900SW JP)もあります。

setTsTitle v1.32を公開しました

setTsTitleのv1.32を公開しました。

setTsTitleにはTSファイルの内部データを参照解析抽出変更する機能はありません。

更新内容(v1.31 -> v1.32)

・*.errファイルにDropがある場合でのリネームに番組情報が使用されない事があるバグ修正

v1.3xの設定ファイルを引き継ぐ場合の更新方法

v1.32の以下のファイルをv1.3xのディレクトリに上書きして下さい。BATファイルを修正する必要はありません。
・stt03.class
・readme.txt

ダウンロード

Google ドキュメントに置いておきます。リンク先のFileボタン->Downloadを選択してください。

setTsTitle_v132_release.zip

File size: 19.9 KB ( 20331 bytes )

SHA256: 42fbe908fd9dd2f109cfcf213e591e95ee4caa31f03e1205e7ef2452b2e97648
SHA1: bbfb73a327da2da7683199cfbba148b05f9c24b3
MD5: 592eae3eeda867d116c7e0a192ebe7cd

2012/08/01

setTsTitle v1.31を公開しました

setTsTitleのv1.31を公開しました。
更新内容はバグ修正のみです。

setTsTitleにはTSファイルの内部データを参照解析抽出変更する機能はありません。

更新内容 (v1.30 -> v1.31)

・サブタイトルの検索範囲の決定処理のバグ修正

v1.30の設定ファイルを引き継ぐ場合の更新方法

v1.31の以下のファイルをv1.30のディレクトリに上書きして下さい。BATファイルを修正する必要はありません。
・stt03.class
・readme.txt

ダウンロード

v1.32を公開しました。

Google ドキュメントに置いておきます。リンク先のFileボタン->Downloadを選択してください。

setTsTitle_v131_release.zip

File size: 19.8 KB ( 20252 bytes )

SHA256: b8a05b4272a7f90541818006b33b6341f2b90ba839a5424c689c7becde428b32
SHA1: 55004b89fd6293727b9299661ffc9b7cd2c1ea81
MD5: 87468659b1adb09638eeac58152f9dec

2012/07/31

HGSTの0S03191(HDS723020BLA642)をもう一台追加購入、WD30EZRXとベンチマーク比較

録画用のテンポラリHDDの容量(1TB)が尽きて一部の録画が失敗してしまいました。
幸い殆どがサンプルデータ収集用の録画だったので問題は無かったのですが、今後同様の事が起きると困るのでHDDを2TBでリプレースする事にしました。

安直に前回購入した物と同じHGSTの0S03191(HDS723020BLA642)を安くて高速なHDDと言う事で選択。
また価格のほうは7月下旬購入時点で9480円でした。6月に別店舗で購入したときは10780円でしたので、12%位安くなりました。


基本スペック
・2TB
・7200rpm
・667GBプラッタ3枚
・SATA-6Gbps対応
・3年保証

*パッケージや付属品、SMART等に関しては前回の記事をご覧下さい。

2012/07/29

setTsTitle

2012/08/02更新 (for v1.32)

setTsTitleとは

setTsTitleはEpgDataCap_Bonが出力した各種ファイルに対して、番組情報ファイルを読み込んでのファイル名成形、ドロップの無いエラーログの削除等の補助処理を行います。
setTsTitleにはTSファイルの内部データを参照解析抽出変更する機能はありません。
またSCRenameとは異なり、EpgDataCap_Bonの出力したファイルのみを参照してリネームしますのでスタンドアロン環境で動作します。

setTsTitleは個人的な研究の過程で開発したソフトウェアです。今まで自分用に使用してきましたが、多少手直しして公開します。
フリーウェアですので非商用目的であれば個人・団体を問わず無料で使用可能です。

動作と機能

引数でディレクトリ又はファイルのフルパスを渡すと、以下の3つの処理を行います。その他の引数はありませんので処理の種類は選べません。
*ディレクトリ指定ではなく、ファイル単体で指定して処理する際は*.ts / *.err -> *.program.txtの順番に処理して下さい。(先に番組情報をリネームしてしまうと参照できない為)

2012/07/21

WD2001FASSをHGSTの0S03191(HDS723020BLA642)で置き換え

 使用時間約8800時間でエラーを吐いたWD2001FASS。C5とC6が出ています。

プログラム開発に使用しているメインHDD、WD製のWD2001FASSがSMARTでエラーを出したので急遽交換することにしました。

WD2001FASSは高速で気に入っていたので後継機のWD2002FAEXの購入を検討しましたが、今更500GBプラッタのHDDを買うのも気が引けるため、価格も手ごろなHGSTのリテールパッケージの0S03191を購入しました。(2012年6月購入時で10780円でした。)

この製品は667GBプラッタ3枚の2TBで7200rpmらしいです。残念ながら現時点では1TBプラッタ採用のDeskstar 7K1000.Dシリーズは単プラッタ品の1TBのものしか無いようでした。
無いものは買えないので、いい具合に枯れている667GBプラッタという事にしておきます。

以下、早速レビュー等。

2012/06/24

logoGuillo開発休止のお知らせ

環境の変化及び諸般の事情により、残念ながら今後の研究開発の継続が困難となったため、logoGuilloの開発を無期限休止する事と致しました。


logoGuilloの公開について

現行版であるlogoGuillo v2.07の公開は継続します。
v1.00からご利用の方はご存じとは思いますが、logoGuilloには非圧縮画像(YV12形式)を画像処理する機能しか実装されていません。
MPEG-2/MPEG-4/H.264等のデコードは外部のAvisynthのプラグインの対応状況に依存します。
また、logoGuilloの出力はテキスト形式によるフレーム番号や時間位置の表示出力のみ可能となっています。入力された動画を編集する機能は実装されていません。

2012/06/11

NeuronDoublerの超解像サンプル画像(x2倍)とSmillaEnlarger、Lanczos-3との画質評価

画像拡大結果を比較する為にNeuronDoublerの他、4種類のソフトウェア及びアルゴリズムでのサンプル画像を作成しました。

v3.05で画質が更に向上しました。(2012/09/11)
v3.10で画質が更に向上しました。(2012/12/20)
v3.10でのサンプル画像の記事


テスト用の画像は全て私(Wirewriggle)が作成又は撮影した物を使用しています。

サムネイル
原寸大のロスレス画像はGoogleドキュメントに置いてあります。
*左上の[File->Download]を押してダウンロードして下さい。

NeuronDoubler_v302_Sample_Compare.png

ダウンロード後に適当なビューアで等倍表示し、御自身で比較検証して下さい。

2012/06/08

NeuronDoubler 導入マニュアル

更新日:2014/02/23

NeuronDoublerの導入マニュアルです。(v3.20対応版)

0.想定環境

開発及び検証環境はWindowsですが、LinuxやMac OS X、Solarisでも動作すると思われます。(未検証)

1.ファイルを用意

以下の三点を用意して下さい。

NeuronDoubler
NeuronDoublerの本体です。

Java Runtime Environment (JRE)
NeuronDoublerの動作にはJREが必要です。 64bit OSを使用している方は64bit版を選択して下さい。 またセキュリティとパフォーマンスの為に、最新版のJREを推奨します。

2012/06/07

人工知能超解像プログラム NeuronDoubler のアルゴリズム(動作原理)

私(Wirewriggle)が独自に開発した人工知能超解像プログラム NeuronDoubler の拡大アルゴリズムを公開します。
基本的には2012/06/04に公開したv3.00の配布パッケージに同梱の解説と同じ物です。


NeuronDoubler Super-resolution algorithm

人工知能超解像プログラム NeuronDoubler v3.02を公開

v3.03を公開しましたのでそちらをご利用ください。

初公開のv3.00をつい先日リリースしたばかりですが、人工知能超解像プログラム NeuronDoublerのv3.02を公開しました。

主な変更点
・バグ修正(主にプレビュー機能周り)
・プレビュー時に処理中の画像周辺のみ表示するようにした
・起動用のBATの修正
・その他コードの整理と修正

入手先

Google ドキュメントに置いておきます。

[ダウンロード]ボタン又は
リンク先の左上のボタンのFile->Downloadを選択してください。

NeuronDoubler_v302_noNN.zip
Ver:3.02
*nnsData非同梱

*人工知能モデル(ニューラルネットワーク)は容量が大きいのでv3.02には同梱していません。
v3.00の配布パッケージのnnsDataフォルダ内のデータ(64個)を、v3.02の配布パッケージのnnsDataフォルダに入れて下さい。

*32bit OS+32bit JVMの環境では付属BATでは動作しない恐れがあります。以下の内容のBATファイルを作成してNeuronDoublerを起動して下さい。( -Xmx の値は環境に応じて要変更)

java -Xms512m -Xmx1500m -jar NeuronDoubler_v302.jar

2012/06/04

人工知能超解像プログラム NeuronDoubler

人工知能超解像プログラム NeuronDoubler 更新:2015/09/23

Artificial intelligence super-resolution Program : NeuronDoubler

2012/05/15

HP EliteBook 2760p Tablet PC (A2N94PA#ABJ)に64bitOS導入とメモリ増設ほか

前回のレビューの続きです。HP EliteBook 2760p Tablet PCにはDDR3-1333のSO-DIMM2枚を増設可能なので、4GBのメモリを2枚(合計8GB)増設しました。

当初は3000円程度のつり下げパッケージの物(CFDとかUMAXとか)にしようかと思いましたが、箱物と価格差が少なかったので、BUFFALOのD3N1333-4GX2/E(PC3-10600 4GB×2枚組)を購入。3980円でした。(2012/05/15時点の価格)


BUFFALOもCFDも同じメルコ系列ですが、BUFFALOの方がマシなチップが載っているだろうという期待を持って選択。

2012/05/13

HP EliteBook 2760p Tablet PCを格安で購入できた

ブログをいつでも何処でも家に帰れないときでも更新・管理できるようにノートPCを購入しました。
購入したPCはHewlett-Packard EliteBook 2760p Tablet PC (A2N94PA#ABJ)です。

このパソコンは今話題のAndroidやApple系のタブレットではなく、2002年辺りで登場したものの高くて重くて普及しなかったWindows系のコンバーチブル型のTablet PCです。普通のノートPCのようにも使用できますが、画面を裏返すとピュアなタブレット風にも使用できます。

タッチ専用のタブレットと異なり、EliteBook 2760p Tablet PCは静電誘導タイプの指でのマルチタッチに加えて、電磁誘導型の筆圧対応したペン入力が利用できます。タッチ&ペン入力にはWacom製のデバイスが採用されています。ワコムのペンタブレットは(ドライバの出来はさておき)高性能で業界シェアの殆どを占めています。

では、ぼちぼち2760p Tabletをレビューしていきたいと思います。

HP EliteBook 2760p Tablet PCの仕様について

通常版(LV741PA#ABJ)はHPの直販サイトで178500円で販売されていますが、若干スペックダウンした廉価版(A2N94PA#ABJ)が54800円で販売されていました。
*2012/05/13現在の価格
Ivy Bridgeも登場したので特定顧客向けのカスタムモデルを投げ売りしているのでしょうか。

2012/05/06

logoGuilloのオプション一覧

(2014/04/11更新、v2.10準拠)

logoGuilloのオプション一覧です。

*詳細が各バージョンのリリースノート中にも含まれている場合があります。
2.05での隠しオプションも含んでいます。

[引数について]

f : 小数
n : 整数
"path" : ファイルへのフルパス

***以下、オプション一覧です***

ロゴ検出型自動CMカットプログラム logoGuillo v2.07 を公開しました

v2.07bを公開しました。

logoGuilloのv2.07を公開しました。
β版での更新内容の統合と小改良です。大体の機能は実装できたので、概ね完成したと思います。

GUIフロントエンドの設定ファイル含め、v2.00-v2.06β2とは後方互換性があります。
また、特に検出パラメータを再調整する必要はありません。

主な変更点は以下の通りです。

・CMカットモードでフレーム毎のロゴ検出値等をCSV出力するようにした
・ログ出力を無効化する機能を追加
・チャプター出力を無効化する機能を追加
・後番組混入防止機能のデフォルト値を修正
・指定ファイルのフルパスをクリップボードにコピーする機能を追加(GUI)

また、下記のv2.06β及びv2.06β2での変更点も含んでいます。
・Dynamic Threshold Control 機能を追加
・CM出力モードの追加
・字幕データに対するネガティブ/ポジティブワード処理の実装
・外部フレームリストとの論理演算機能を追加
・アンチウイルスでの誤検出対策

2012/05/04

logoGuilloの出力を加工してくれるスクリプトが登場

logoGuilloの出力を加工してくれるperlスクリプトが公開されていました。有り難う御座います。

つれづれ~努力と根性?~:続・TDFM2EVFR的な何か

logoGuilloの出力をシーンチェンジ検出と自動VFR用のfps判定を考慮して加工してくれるようです。
15秒単位でのシーンチェンジ検出を行う事で、本編->提供->CMの流れでのロゴ無し提供画面の取りこぼしを防止しているらしい。

*詳細はリンク先で確認して下さい。

ニュースや映画等では提供画面がCMの途中に単独で存在したりCM明け前に挿入されていたりする場合もあるので、アニメ向けでしょうか。
私はどんな番組でも妥協して24fpsか30fpsのCFRに押し込んでしまいますが、VFRを使えば自動で完成度の高いファイルを作成できそうです。

2012/05/02

logoGuilloの仕様と動作環境及び制限事項

logoGuilloの仕様と動作環境及び制限事項です。(v2.12準拠)

logoGuilloは32bit版と64bit版がありますが、特に理由がない限り64bit版を推奨します。

 * v2.12以降は、32bit版は廃止しました。

●動作環境(ハードウェア)

[CPU(最低条件)]
・x64 CPU (v2.10まではx86 CPU)
・対応拡張命令:MMX/SSE/SSE2

[CPU(推奨条件)]
・x64 CPU
・対応拡張命令:MMX/SSE/SSE2/SSE3/SSSE3/SSE4.1/SSE4.2 (≠ SSE4A)
・Intel製CPU(Nehalem以降)
*Nehalem以降のCPUではSIMD演算が使用されるので高速化されます。

2012/04/30

logoGuilloの動作精度を上げる為の注意点

一部FAQと重複する内容もありますが、logoGuilloの動作精度の向上に関係する事を書いておきます。

ロゴの検出精度を向上させる

ロゴの検出精度を向上させる事は全体的な精度の底上げに繋がります。

[ロゴデータを作成する際の注意事項]

ロゴデータの出来は重要です。目安としてはロゴが綺麗に消せる程度の精度が必要となります。

・MPEG-2 VIDEO VFAPI Plug-In で余計な処理が行われない設定にします。
・AviUtlでのリサイズを無効にします。
・AviUtlでのフィルタを無効にします。
・AviUtlでのインターレース解除を無効にします。
・ソースにはアニメ等、単色ベタが多い物を使用します。
・ブロックノイズの多いソースはロゴの品質低下の原因となります。
・ロゴの含まれないシーンが紛れ込まないように削除しておきます。
・ロゴ解析の閾値は低めの値にしておきます。(16等、サンプル数が少なくなりすぎない程度に設定)
・ロゴ解析の選択範囲はロゴのエッジから3~4ピクセル程度にします。

2012/04/29

ロゴ検出型自動CMカットプログラム logoGuillo v2.06β2 を公開しました

v2.07を公開したのでそちらを使用して下さい。旧版は削除しました。

前回に続きlogoGuilloのβ版、v2.06β2を公開しました。またβ版につき、配布内容はバイナリのみですのでv2.05の配布パッケージと合わせてご利用下さい。

v2.06βからの主な変更点は、Dynamic Threshold Control 機能の実装です。

高輝度でロゴが見えない局でロゴの背景に高輝度のテロップ等が長期間表示されるとロゴが認識できず本編の一部が欠落する事がありますが、その場合は本編の割合が減少します。
通常は8割程度は本編の筈なので、本編が7割以下しか検出出来なかった場合にはDTCが検出漏れがあると判断しロゴ検出閾値を自動で下げます(増感します)。

また、今回の配布パッケージから実行ファイル名は全て"logoGuillo.exe"としてx64/x86それぞれをディレクトリ分けする事にしました。

2012/04/25

logoGuillo開発近況(2012/04/25)

現状でのlogoGuilloの開発ToDo等。下記のうちDTCは優先的に実装中なのでGW中頃には完成させたいと思います。

●Dynamic Threshold Control (仮) *v2.06β2に実装予定

番組中の本編の割合が規定値以下の場合、ロゴ検出閾値を下げます。

ロゴの背景にテロップや複雑なパターンが長期間表示されるとロゴが認識できず本編の一部が欠落する事がありますが、その場合は本編の占める割合が減少します。通常ですと7割ぐらいは本編があるはずなので、例えば6割しか本編が検出出来なかった場合には何かしら検出漏れがあると見なしてロゴ検出閾値を下げます。
つまりロゴ検出感度を自動で増感する事になるので、当然CMの誤検出発生とはトレードオフの関係にあるわけですが、一部のシーンが丸ごと抜けるような事故の発生を防ぐ事が出来ます。この機能は感度が落ちる方向には制御されない為、常に安全側に動作します。

他にも時間辺りのパート数等も利用できそうですが、あまり放送のお作法に依存すると汎用性が下がるので当面は本編の割合のみを考慮する予定です。

2012/04/22

ロゴ検出型自動CMカットプログラム logoGuillo v2.06β を公開しました

v2.07を公開したのでそちらを使用して下さい。旧版は削除しました。

そろそろlogoGuilloを初公開してから半年です。ほぼ実証実験に近いv1.00の頃から利用されている方は少ないとは思いますが、今までお付き合い頂き有り難う御座います。

さて、今回logoGuilloのv2.06βを公開しました。v2.05からはポスト処理系の機能追加がメインの小改良ですが、あまりデバッグが出来ていないので人柱向けのβ版となっています。またβ版につき、配布内容はバイナリのみですのでv2.05の配布パッケージと合わせてご利用下さい。

主な変更点は以下の通りです。

・字幕データに対するネガティブ/ポジティブワード処理の実装
・外部フレームリストとの論理演算機能を追加

logoGuilloは自動的に不要なシーン(CM)を判定する事で、視聴時間と容量を節約する事を目指してきました。なるべく本編が欠けないよう安全側に設計してあるので、全自動で任せても不完全ながらそれなりの結果を得られるようにはなったと思います。
今回は更に一歩、字幕情報を元に内容にまで踏み込んで不愉快なシーンを取り除く実験です。某社のレコーダーのダイジェスト再生とは逆の発想です。

ネガティブワード機能は、不愉快なキーワード等を登録して、特定の話題周辺のシーンを削除する機能です。
嫌なら見るな、という言葉に習い番組内の興味のない話題を自動で排除してみましょう。


2012/04/15

外観完成後の東京スカイツリーをNEX-5Nで撮影してきた


まだ開業前ですが、外観が完成した東京スカイツリーの周辺に行ってきました。
作例と呼べるような物を撮れる腕はないので、適当に散策しながら撮影した写真を載せておきます。

使用機材等

カメラ
・SONY NEX-5N

レンズ
・SEL1855(キットズーム)
・SEL16F28+VCL-ECU1(キットパンケーキ+ワイコン)

三脚は面倒なので全て手持ち撮影。

写真

2012/03/21

WD15EARSが故障したのでWD30EZRXと外付けUSB3.0ケースを追加購入


録画機のWD15EARSが故障しました。SMARTによるとC5(代替処理保留中のセクタ)とC6(回復不能セクタ)が発生した模様。CrystalDiskInfoで監視していて早めに気づいた為か、録画した動画が一本破損したのみで他のデータは無事でした。0フィルするとC5/C6は一旦クリアされますが、リードスキャンすると再度カウントされる状態です。

WDのEARSシリーズは5台使用していましたが、壊れたのはWD15EARSの2台だけです。同一店舗で二台購入した後、10ヶ月後に1台目、25ヶ月後に2台目が故障しました。残りの姉妹モデル3台(WD20EARS)は何ともないのでハズレのロットを引いてしまったのかも知れません。今後は2台購入する場合はそれぞれ別店舗から調達しようと思います。

2012/03/19

logoGuillo v2.05の隠しオプションと隠し機能

logoGuillo v2.05の隠しオプションと隠し機能です。基本的にデバッグ用ですが、色々と試してみたい方の為に公開しておきます。

使用すると予期せぬ不具合や誤動作を招く危険性があります。
また、今後予告無く機能及び効果やデフォルト値等が変更される場合があります。下記オプション・機能を使用する場合は十分に注意して下さい。


隠しオプション


-fstStep n

初回読み込み時の間隔(frame)を設定する
デフォルト値:57

logoGuilloはCMと本編を判別する為、動画を読み込んで分析する処理を2段階で行っています。Phase1で大まかに、Phase2で詳細な分析をしています。このオプションを使用する事でPhase1でのフレームの読み込み間隔を変更できます。
エンドカードや次回予告、提供等の短い本編が無い番組(映画やバラエティ、ニュース等)ではある程度大きな値にする事で、Phase1での処理の高速化が期待できます。但し、極端に大きい値を設定した場合はPhase2での処理時間が増加したり、-strict オプションを併用しないと不正な結果になる可能性があります。
また、15の倍数を指定すると毎回特定位置のB/Pフレームのみ読み込むケースもあり得る為、何らかの影響が出る可能性があります。

2012/03/18

MPEG2形式の動画をAvisynthから読み込む方法4種

AvisynthからMPEG2形式の動画を読み込む方法を、logoGuilloでサポートしているプラグインを中心に載せています。m2v.vfpとDGIndexの2種類がメジャーな方法だと思います。

Avisynthは出来る事が多いソフトウェアですが、動画を読み込むだけならAvisynthのpluginフォルダに使用したいプラグインを入れ、AVS上で記述して呼び出すだけで利用できます。但し、Avisynthのプラグインのオートローディングが動作しない一部の環境ではpluginsフォルダに入れたプラグインが自動的に読み込まれないので、LoadPlugin()を使用して明示的に読み込むプラグインを指定する必要があります。

検証環境:
・Avisynth 2.58 x86
・Windows 7 x64

2012/03/12

SONY NEX-5Nの実際の撮影可能枚数

NEX-5Nのバッテリーの持ちについてメモ。

NEX用のバッテリー(NP-FW50)二個。高いですが念のため純正品を選択。

大きめの純正充電器(BC-VW1)。80%充電までの所要時間も公開して欲しい所です。

設定

バッテリーの持ちに関係しそうな項目の基本設定を抜粋。撮影中は一部の項目を一時的に変更したりしています。

NEX-5NのファームウェアをVer. 1.01に更新

SONY NEX-5Nのファームウェアアップデートが公開されていたので、Ver. 1.01にアップデートしました。更新内容はAF改善とバグフィックスの二点。

ファームウェアの更新

Windows 7 SP1 64bit+P55内蔵USB2.0ホストで正常にVer. 1.00からVer. 1.01にアップデートできました。
一回目は途中でコントロールホイールの中央を押してカメラ側をリセットするのを忘れていて失敗。二回目で正しく手順通りに作業して無事成功。
ファームウェアを更新するとAF微調整の調整値がリセットされるようですが、LA-EA2は使用していないので関係ありませんでした。また、特にその他の設定項目の初期化等は行われませんでした。

更新内容について

以下、更新内容についてソニーのアップデート情報より引用と感想。

>1. AFレスポンス向上
>  ・被写体距離が大きく変化した際のAFレスポンス向上。

2012/03/09

logoGuilloの誤検出の件でカスペルスキーから回答が来た

2012/05/06追記:*アンチウイルスの誤検出はv2.07でほぼ解決しました。(実行ファイルにファイル名などのプロパティ情報を追加しました。)

先日Kasperskyの日本法人に問い合わせした、カスペルスキー インターネットセキュリティ 2012でのlogoGuilloの誤検出について回答が来ていました。

カスペルスキーによると、調査の結果logoGuillo v2.05のウイルス検出は誤検知であり既に修正済との事でした。少なくともv2.05に関しては2012/03/02以降での定義ファイルでは修正されているはずです。

オンラインスキャンサービスで確認

( 2012/03/09現在 、VirusTotalでv2.05の配布アーカイブをスキャンした結果を一部抜粋)

2012/02/29

logoGuilloの誤検出の件でカスペルスキーに問い合わせる

2012/05/06追記:*アンチウイルスの誤検出はv2.07でほぼ解決しました。(実行ファイルにファイル名などのプロパティ情報を追加しました。)

logoGuillo v2.05がカスペルスキー2012で誤検出されるとの連絡を受けたので、一旦DTVアップローダーからは該当ファイルを削除し、Google ドキュメントで公開しています。

アンチウイルスの誤検出絡みで検索していたら以下のような記事を見つけました。
FPS戦争ゲームのWarRock > 一部ウイルスセキュリティソフトの誤動作についてのお知らせ

この記事によると、カスペルスキーの他にAvast、F-Secure、Avira、Kingsoft Internet Security等の複数のソフトウェアで誤検出されることが有るようです。
Avastは以前logoGuillo v2.03の32bit用バイナリを誤検出された事があったので、上記ソフトは定義ファイルや検出エンジンが似た原理になっているのでしょうか。

とりあえず、この件に関してカスペルスキーの日本法人に問い合わせる事にしました。
(ちゃんと返信が帰ってくるかは不明ですが)

現在私自身が多忙な為、次回更新は1週間以上先になりそうです。

2012/03/09追記:Kasperskyから回答が来ました

関連記事
logoGuillo v2.03がAvast!にマルウェア扱いされるらしい

2012/02/26

logoGuilloで検出パラメータ自動調整時に出力されるrawLmLvMap.csvについて

logoGuillo v2.05で検出パラメータの自動調整を行った際に出力されるファイル(rawLmLvMap.csv)についての説明です。
このCSV形式のファイルには、自動調整に使用した動画の各フレームの輝度及びロゴ検出値と自動調整の結果が記録されています。
自動調整結果の確認や、どうしても自動調整が上手くいかない場合に手動で修正する際に利用できます。

輝度-ロゴ検出値特性と検出パラメータの関係

Brightness - Logo detection level & Thresholds

2012/02/24

最近の白芝はMLCらしいのでベンチマークしてSLCと比較してみる

東芝製の白いSDカード、通称「白芝」の16GB版をNEX-5N用に購入したのでベンチマークしてみました。

外観とスペック

ベンチマークするSDカード3種

写真中央が今回購入した
東芝 SD-T16GR6WA2 16GB class 10(裏面刻印:SH016GAA2BB、日本製)
です。スペックはRead:23MB/s、Write:19MB/s(パッケージ記載値)。
以前はSLCの物しか無かったのですが、最近はMLCに切り替わっているらしいのでベンチマークを取って検証してみます。

2012/02/23

ロゴ検出型自動CMカットプログラム logoGuillo v2.05 を公開しました

v2.07を公開したのでそちらを使用して下さい。v2.05は削除しました。

logoGuilloのv2.05を公開しました。機能追加とバグ修正がメインです。前後ディップによる分割機能の実装は先送りしました。

GUIフロントエンドの設定ファイル含め、v2.00-v2.03とは後方互換性があります。
また、特に検出パラメータを再調整する必要はありません。

主な変更点は以下の通りです。

・ポストフィルタ処理の強化により高輝度CMの除去を行うようにした
・字幕データを利用してロゴ検出結果を補完するようにした
・DGIndex(*.d2v)のサポート
・Avisynthのプラグインのオートローディングが正常に動作しない環境への対策

2012/02/20

現在のMPEG-2 VIDEO VFAPI Plug-Inの設定

私のMPEG-2 VIDEO VFAPI Plug-In(m2v.vfp)の設定です。
普段のエンコードの他、logoGuilloの入力プラグインとしても使用しているのでlogoGuilloで上手くビデオが読めない場合はこの設定を試してみて下さい。

m2v.vfpに同梱されているm2vconf.exeを実行する事で設定画面が開きます。

設定項目は多くは無いですが、下記の設定を推奨します。

GOPリストを保存する

初回読み込み時にGOPリストを生成するために少し待たされますが、高速にシークできるのでAviUtlでのCMカット作業などで便利です。またlogoGuilloでの処理速度が高速化する筈です。
GOPリストを前もって生成したい場合にはmme.exeが利用できます。m2vファイルに対して予めGOPリストを生成するBATを組んでおくと直ぐに開けます。

2012/02/19

NEX-5N用にウルトラワイドコンバーターVCL-ECU1を購入

SONY NEX-5N用にウルトラワイドコンバーター(VCL-ECU1)を購入しました。
このワイコンはE16mm F2.8(SEL16F28)専用で、装着するとF2.8のまま12mm(35mm換算で18mm)の画角になります。また、最短撮影距離が0.24mから0.18mに短縮されます。(マニュアル記載値)

ちなみにマニュアルはフィッシュアイコンバーター(VCL-ECF1)と共通でした。魚眼では最短撮影距離が0.13mになるようです。

外観と簡易レビュー

SEL1855やSEL16F28はタイ製でしたが、VCL-ECU1は日本製でした。

2012/02/12

logoGuillo開発近況(2012/02/12)

v2.05をリリースしました。

logoGuilloの開発をぼちぼち継続中です。追加機能の実装が大体完了して録画した番組も溜まってきたので、そろそろデバッグに入れそうです。
リリース時期のほうは現在未定となっています。

主な変更予定

2012/02/07

KINGの小型10段三脚を購入して早速改造してみた

NEX-5Nを卓上で使用する為に、浅沼商会(ブランド名:KING)の縮長16cm、約400g(公称値)の小型三脚
「ポケット10段小型三脚」を購入しました。
一段だけ伸ばした状態(改造後)。この状態では足を回してロックできるので不用意に縮む事は有りません。改造しない状態で10段まで全部伸ばすと伸長63cm(公称値)になります。
ところが、私が想定していたよりも足が開かず、NEX+キット付属ズームレンズを載せると足を伸ばさない状態では流石に無理があり非常に転倒しやすい事が判明したので、早速足が広がるように改造してみました。

2012/02/06

logoGuillo v2.03がAvast!にマルウェア扱いされるらしい

2012/05/06追記:*アンチウイルスの誤検出はv2.07でほぼ解決しました。(実行ファイルにファイル名などのプロパティ情報を追加しました。)

友人よりlogoGuillo v2.03の32bit版がAvast!にマルウェア扱いされるとの報告を頂きました。(2012/02/04前後頃の定義ファイルらしい)

logoGuillo内部の処理はAvisynthから間接的に受け取ったビデオをひたすら画像処理するだけなのですが、外部プログラムのavs2yuv.exeをパイプ経由で実行する動作が引っかかっているのかも知れません。

64bit版と32bit版のソースは同じですが、何故片方だけ誤判定されるのか分からないので取り敢ずlogoGuilloとフロントエンドのアクセスするファイルについて記載しておきます。両者ともレジストリにはアクセスしません。また完全なオフライン用です。

2012/02/03

MPEG2を再エンコードせずにCMスキップ用チャプター&字幕付の(m2v+aac).mp4を作成する

logoGuilloで出力したCMスキップ用のチャプターを利用して、MPEG2を再エンコードせずに(m2v+aac).mp4を作成します。
映画やドラマ等、エンコードしても時間の割に圧縮されないソースのCMスキップを可能にします。

必要なもの
mme.exe(MPEG-2 VIDEO VFAPI Plug-Inに同梱)
logoGuillo(+動作環境)
MP4Box
文字コード変換ソフト(CLI,S-JIS -> UTF-8)

2012/02/02

SONY NEX-5Nはヒストグラムを常時表示できない

SONY NEX-5Nを購入しました。他にもミラーレス一眼のNEX-7やV1,J1,各m4/3辺りと比較検討しましたが、高感度特性重視で画素ピッチの大きい5Nを選択。
ソニーのCMOSセンサーはフルサイズ未満の現行製品の中では、少なくとも高感度撮影においては非常に良いです。ISO3200辺りまでは気軽に使えます。

さて、表題のNEX-5Nがヒストグラムを常時表示出来ない問題ですが、下の画像をご覧下さい。一枚に繋げてありますが、上から順に以下の状態で背面液晶を撮影したものです。
・画面表示モード:全情報表示
・画面表示モード:グラフィック表示
・画面表示モード:ヒストグラム
・露出補正中の画面

2012/01/29

現在運用中のAvisynth Scriptのマスタ

現在運用中のAVSファイルのマスタに関しての記事です。AVSファイルだけ出しても分かりにくいので、先ずはエンコードの基本的なフローからご覧下さい。

エンコードの基本フロー
  1. (*.m2v + *.aac)を用意する
  2. (*.m2v + *.aac)に対するCMカット用のTrimコマンドを生成しておく
  3. 音声(*.aac)をFakeAacWavで疑似wavファイル化(*.wav)
  4. AVSに動画(*.m2v)と音声(*.wav)を読み込み、x264で動画をエンコード(*.mp4)
  5. AVSファイル内でCMカットした音声(*.wav)を出力
  6. CMカットした疑似wavファイル(*.wav)をFakeAacWavでaacに戻す
  7. x264でエンコードした動画(*.mp4)にMP4BoxでCMカット済aacをMUX
*FakeAacWavで疑似wavファイルを生成する段階で、ファイル名に記述されている音声と動画の時間差("* DELAY -*ms.aac")が処理されるので音ズレが発生しません。

コンセプト等
  • 実写ソースは重たい上に縮まないので滅多にエンコードしません。その為、対象は24fpsソースのみです。
  • インターレース解除の誤判定を防ぐ為、縞判定せず一律で処理します。
  • 30/24混合や60iテロップ等の処理が面倒なので逆テレシネ処理で全て24fps化します。
  • x264側でcrfを下げるより軽くノイズリダクションを掛けた方がサイズ対画質で良い結果が得られたので、輝度だけFFT系3DNRを加えます。
  • シャープフィルタはNR処理による解像感低下の埋め合わせ程度に軽くかけます。
  • 見栄えさせる為の色調補正やシャープフィルタの類は再生時に行うべきだと考えています。YC伸張はしません。

2012/01/26

logoGuilloのログ(*_autoCutSummary.log)の読み方とCMカット結果の簡易チェック方法

(2012/04/29更新) v2.06β2に準拠

logoGuilloで自動CMカットを行った際に出力されるログ("ファイル名_autoCutSummary.log")の読み方です。
メモ帳などのテキストエディタに拡張子*.logを関連づけておくと、そのまま開けます。

結果の簡易チェック方法

本編の各パートの尺と、本編中のCMの尺が切りの良い長さになっているか確認します。
logoGuilloは1フレーム内にCMと本編の両方が含まれる場合には本編中にCMが含まれないようにカットします。その為、完璧に動作した場合でも最大で本編は2フレーム短く、CMは2フレーム長い事があります。

また同じ番組を複数本処理する場合では、各話で本編のパート数と全体の総時間が変わらないのでそこを確認します。
但し最終回では次回予告が無い為、 番宣が代わりに入らなければ15秒程度短くなる事があります。

正確にカット出来たログの例と読み方

2012/01/22

logoGuilloの出力結果をAviUtlで確認し修正する方法(半自動CMカット)

私が普段エンコードに使用している半自動CMカットの方法です。(Ver. 12/01/22)

自動CMカット処理の結果を手がかりにして高速にCMカットを行います。
ついでにチャプター情報も生成する事で本編のパート毎に移動可能にします。

人間が行う作業はlogoGuilloの出力結果をAviUtlで確認し、ずれている場合に修正するだけです。
30分番組10本の修正作業に要した時間を計測してみたところ、約24sec/話でした。

エンコード自体はAvisynthで行う事を前提にしていますが、動画を読み込む際に音声も読み込めばAviUtlでのエンコードにも応用できます。

大まかなフローを先に書きます。

1.BATでの自動処理A
  • logoGuilloで.keyframe形式でCMカット結果(仮CMカットファイル)を出力
2.手動作業
  • logoGuilloAUP.aufを導入したAviUtlで動画を開く
  • 本編の出入りのフレームがマークされる
  • マークフレームに移動し、正しい位置をキーフレーム指定
  • キーフレームリストを書きだし(本CMカットファイル)
3.BATでの自動処理B
  • 書き出したキーフレームリストからTrimコマンドとチャプターを生成
  • エンコードしてチャプター埋め込み
では具体的な作業手順に入ります。

2012/01/15

USB3.0対応フラッシュメモリ:GH-UFD3-32GSベンチマーク

GREEN HOUSE PicoDrive S3の32GBモデル、GH-UFD3-32GSのベンチマークです。


特長と簡易レビュー
  • USB3.0対応&2チャネル転送で高速(R:80MB/s、W:25MB/s、パッケージ記載のメーカー公称値)
  • 安価(速度の割に)
  • 筐体の材質はアルミ
  • 末尾にストラップ穴有り
  • アクセスランプは半透明プラスチック製のストラップ穴部分が赤色に光ります。
  • アクセスランプの明るさは控えめ。
  • 外したキャップは末尾には装着できません。
  • USBコネクタのPC側端からの長さは68-69mm程度、PicoDrive DUAL 無印(GH-UFD*GD)とほぼ同じ。
  • 最近のUSBフラッシュメモリと比べると長めです。

2012/01/14

ロゴ検出型自動CMカットプログラム logoGuillo v2.03 を公開しました

v2.05を公開したので、そちらを使用して下さい。v2.03は削除しました。

logoGuilloのv2.03を公開しました。機能追加とバグ修正がメインです。
まだ実装したかった機能が何個か残っていますが、v2.00では一部のCPUで未対応の拡張命令を実行してしまう不具合が有ったので前倒しでリリースです。

GUIフロントエンドの設定ファイル含め、v2.00とは後方互換性があります。
また、特に検出パラメータを再調整する必要はありません。

主な変更点は以下の通りです。
  • 別のロゴ検出アルゴリズムを追加 *テレビ朝日等、今まで検出出来なかったロゴを検出する為に追加。
  • シーンチェンジ検出エンジンの改良
  • 出力機能の改良
  • 拡張命令の使用を制限する機能を追加
  • 同梱のatf02にTrimに加えてチャプター出力機能を追加

DTV関係ツールのDTV アップローダ(DTV関係ファイル置き場)をお借りしましたので、そちらから入手して下さい。

ロゴ検出型自動CMカットプログラム logoGuillo v2.03 機能追加及びバグ修正等
up0831.rar
MD5:133f178785efc66a66548941326954e3

変更点

(v2.00 -> v2.03)

2012/01/09

logoGuillo v2.00のAMD製CPU環境における動作停止問題について

2012/01/14追記:v2.03で未対応拡張命令を実行するバグの修正、拡張命令無効化機能を実装しました。

logoGuillo v2.00を一部のAMD製CPUで実行した場合、対応拡張命令確認機能のバグによりPhase(2/2)で動作停止する不具合が発生します。
恐らくSSE4aをサポートしているCPUで発生するものと思われます。

今週中には拡張命令の使用を制限可能な機能を加えた次期バージョンを前倒しでリリース致しますので、該当するCPUを御使用中の方は今暫くお待ち下さいますようお願い申し上げます。

また、不具合報告して下さった方、有り難う御座いました。

2012/01/02

logoGuillo FAQ

2012/02/23更新 for logoGuillo v2.05

ロゴ検出型自動CMカットプログラム logoGuillo FAQ


Q.局毎に変更する必要のある物は何ですか

A.局毎に変更する必要のある物は以下の通りです。一度作成すれば同じ局の番組で使い回すことが出来ます。
  • ロゴデータ(*.lgd)
  • ロゴ検出パラメータ(*.param)