May the Neural Networks be with you

ニューラルネットワークと共にあらんことを

ワシントンDCで行われた国際会議で発表してきて、そのノリでニューヨークとボストンに行ってきた 1/4

こんにちは。@shunk031です。段々と寒くなってきましたね。足元にGPUマシンだけが暖かく見守ってくれる季節になりました。

初めての国際学会でワシントンDCに3泊4日、その後移動してニューヨークに3泊4日、ボストンに3泊4日ほど観光してきました。 そもそも海外渡航が初めてだったので、準備等も含めて旅行記のようなものを残しておきます。

f:id:shunk031:20181025074202j:plain

目次

海外渡航準備

ビザ免除プログラム (ESTA)

アメリカへ短期間の滞在の場合、ESTAを取得することでビザ無しで入国することができます。申請には $18 ほど必要なのですが、ぼったくりサイトもあるようです。 以下のリンクは正規のESTA申請サイトでした。 .gov ドメインが付いている政府のサイトなので大丈夫ですね。

https://esta.cbp.dhs.gov/esta/application.htmlesta.cbp.dhs.gov

インターネット環境 (SIMカード)

SIMフリーOPPO R15 Proを持っていたため、アメリカで使えるプリペイドSIMカードを購入しました。 今回は同じ学会で発表する同期の分も合わせて以下の2つを購入してみました。

入国審査

「学会発表に来たよ〜」と言ったら「そんな若者が学会で発表するはずない」みたいなことを言われて一瞬焦りましたが、参加登録のメールを見せたら通してくれました。よかった。

学会発表

今回ワシントンDCのCosmos Clubで開かれたApplied Imagery Pattern Recognition (AIPR) 2018 workshopにて学会発表を行ってきました。 www.tripadvisor.jp

Applied Imagery Pattern Recognition (AIPR) 2018 workshop

今年で47回目の由緒ある学会でした。コンピューターサイエンスの学会だとラフな格好でも大丈夫な場合が多いと思いますが、Cosmos Clubというこちらも由緒正しい会場での開催のため、ドレスコードがありました。

www.aipr-workshop.org

End-to-End Text Classification via Image-based Embedding using Character-level Networks

本学会では以下の内容について口頭発表させていただきました。

日本語や中国語等の自然言語処理をするとき、形態素解析が困難な場合が多いです。そこで文字単位で入力を行うことはもう一般的と行ってもいいでしょう。 今回の論文では日本語・中国語の文字の表意性を文字画像から抽出し、その特徴量をもとに高精度に文書分類を行いShimada et al*1に対して、End-to-Endのモデルに発展させたCE-CLCNNというモデルを提案しています。こうしたアーキテクチャから、CE-CLCNNでは以下のような長所を持ちます。

  • 困難な形態素解析が不要
  • 文字の形状的特徴を考慮した文字表現の学習
  • 画像に対するdata augmentationおよび文字表現に対するdata augmentation

通常の自然言語処理におけるdata augmentationは、前述の通り難しい形態素解析を行い、意味解釈を経なければなりません。 この提案モデルでは文字単位の入力に対して、意味解釈が不要な文字の見た目をうまく捉えるようなdata augmentationを適用可能としており、文書解析能力が向上しております。 自然言語処理に対して画像処理分野のdata augmentationの応用が可能な、面白い研究になったと思っています。

詳しくはarXivにも公開しておりますのでぜひご一読いただければと思います。

[1810.03595] End-to-End Text Classification via Image-based Embedding using Character-level Networks

観光

なんとか初めての国際学会での発表を終えて、これからが本番です。ワシントンDC、ニューヨーク、ボストンの主要観光スポットをいい感じにまわる戦略でやっていきました。 観光するにあたり、Google mapのマイマップ機能はとても重宝しました。 dekiru.net

観光時にはAirbnbを使って格安で部屋をとりました。今回お世話になったホストさんたちはとても親切で、観光名所などを丁寧に教えていただけました。 abnb.me

移動には基本地下鉄を使いました。Pasmo/Suicaのような地下鉄カードを買っていい感じにチャージするとスムーズに乗れました。 夜まで観光してしまった場合はUberを使いました。初めて使ったんですがとても便利ですね。

https://www.uber.com/invite/epgfsxwww.uber.com

初日のワシントンダレス国際空港からホテルへは乗り合いのシャトルバスSuper Shuttleを使ってみました。 行き先を予め予約しておくとかなり格安で市街地のホテルまで乗せて行ってくれます。 私は予約せずにのりばのお姉さんに行き先を言って乗車したのですが、それでもUberの半額程度で目的地まで乗せてくれました。 www.supershuttle.com

ワシントンDC

学会発表終わりのワシントンDC観光編はこちら。 shunk031.hatenablog.com

ニューヨーク

ニューヨーク観光編はこちら。とても刺激的な街でした。 shunk031.hatenablog.com

ボストン

ボストン観光編はこちら。有名大学を中心に観光しました。 http://shunk031.hatenablog.com/entry/aipr2018_04shunk031.hatenablog.com

*1:Shimada, Daiki, Ryunosuke Kotani, and Hitoshi Iyatomi. "Document classification through image-based character embedding and wildcard training." Big Data (Big Data), 2016 IEEE International Conference on. IEEE, 2016.