画像キャプチャサービス「Gyazo」と関連画像検索システム

画像キャプチャサービス「Gyazo」と関連画像検索システム画像キャプチャサービス「Gyazo」と関連画像検索システム
	増井俊之
	慶應義塾大学
	2017/3/13
	情報処理学会 CGVI研究会 第166回研究発表会
	http://masui.org/cgvi
	

自己紹介
	シャープ、ソニー、産総研などに勤務
		ケータイの予測変換(POBox)などを開発
	2008秋まで米国Appleに勤務
		フリック入力システムなどを開発
	2009より慶應義塾大学
		ユーザインタフェースの研究開発
		IoT, 検索システム, 情報視覚化
	各種Webサービス運用中
		Gyazo, Scrapbox, 本棚.org, ...

POBox
	

POBox on Palm
	

「フリック」入力
	

スマホに満足してますか? - ユーザインタフェースの心理学
	光文社新書
	

煽り
	

増井の研究開発方針
	自分の欲しいものを作る
	自分で使う
	コロンブスの卵が好き
	今すぐ使えて売れるものを作る

コロンブス日和
	
	技術評論社のSoftware Designの連載記事
	GyaTV (2015/11)
	Gyump (2015/12)
	Gyamm (2016/1)
	Gyazo (2016/2)
	Gyaki (2016/3)
	Dynamic Macro (2016/4)
	Gyaim (2016/5)
	EpisoPass (2016/6)
	ExpandHelp (2016/7)
	DragZoom (2016/8)
	Gear (2016/9)
	SmoothSnap (2016/10)
	廃れるページ (2016/11)
	HashInfo (2016/12)
	フラット整理術 (2017/1)
	Scrapbox(1) (2017/2)
	Scrapbox(2) (2017/3)
	発見プログラミング (2017/4) = 最終回

ドッグフーディング
	Eat your own dogfood
	自分で作ったものを使い倒して改善する

Gyazoとは
	超簡単な画像アップロードサービス
	

Gyazoキー
	

デモ: Gyazo

Gyazo (2010/7)
	

Gyazo (2012/1)
	

Gyazo (2014/1)
	

Gyazo (2015/1)
	

Gyazo (2015/9)
	

Alexaデータ (2013/11/14)
	

Alexaデータ (2014/1/15)
	

Alexaデータ (2014/10/27)
	


Alexaデータ (2015/3/3)
	

Alexaデータ (2017/3)
	

資金ゲット!
	

Gyazo紹介
	

セールスピッチ
	

Gyazo導入企業
	

Gyazoの成長
	

関連サービス
	

Gyazoの歴史
	2007/9 増井が個人で運用開始
	2010? Nota inc. でサポート開始
	2014/4 Gyazo GIFリリース
	2014/11 資金ゲット
	2015/7 IvySearchリリース
	2016/7 OCR リリース

機能は画像をアップするだけ
	関連URLなどを保存
	関連画像の表示

ビジネスモデル
	フリーミアム
	広告

Gyazoのデータ量
	月間アップロード2400万枚
	月間ユニークユーザ1000万

Gyazoの運用環境
	海外サーバ
	Elastic Searchによる全文検索
	MongoDBでメタデータ管理

画像検索の考察

検索の分類
	知ってるものの検索
		見たことがあるものにアクセス
		e.g. 古い写真の検索, ファイル検索
	知らないものの検索
		見たことがないものを捜す
		e.g. Google検索, 写真素材検索

知ってるものの検索
	一度見たことがある
	関連情報を覚えている
	みつからないと腹がたつ
	例
		古い写真
		古い書類

知らないものの検索
	存在するかどうかも不明
	みつからなくても平気
	例
		知らない情報
		写真素材

画像の検索方法
	イメージ中身で検索
	メタデータで検索

両者の比較
	自分の写真の検索の方が機会は多い
	画像をアップロードしたことは覚えている
	全く知らない画像を検索することは少ない
	関連情報からの検索が有用な場合は多い
	「豪邸」とか「喧嘩」とかを検索できるか?
	「赤坂で会った人」を検索できるか?

漠然としたことは覚えている
	日時
	場所
		地名、緯度経度
	人物
	環境
		温度、音楽、...
	関連キーワード

関連情報検索
	「芋蔓式」検索が大事

IvySearch
	

IvySearch
	

デモ: IvySearch

例: 「請求書」

例: 「自転車」

例: 「名山」

例: 「イギリス」

例: 「テンセグリティ」

実装
	ElasticSearchを利用
	kuromojiで形態素解析
jsonCopied!
{
 "cluster_name" : "ivy",
 "status" : "green",
 "timed_out" : false,
 "number_of_nodes" : 5,
 "number_of_data_nodes" : 4,
 "active_primary_shards" : 16,
 "active_shards" : 32,
 "relocating_shards" : 0,
 "initializing_shards" : 0,
 "unassigned_shards" : 0,
 "delayed_unassigned_shards" : 0,
 "number_of_pending_tasks" : 0,
 "number_of_in_flight_fetch" : 0
}
	Spec
		8 vCPUs, 52 GB memory, 1TB SSD

運用
	Gyazoったときはキーワードも入れる
	写真をDrag&Dropしてコメントを書く

芋蔓検索の強み
	自分のコンテンツなのにナビゲーションが面白い
	意外と検索に成功する
	関係ないものが出てきて面白い
		セレンディピティ支援

芋蔓検索を有効にするコツ
	どんなものでも画像でセーブ
	コメントかキーワードを自分で書いておく
	全部にキーワードをつけない
		つけすぎると大変なことに
	自動があってももちろんかまわない
		タイムスタンプやOCRは有効

キーワード付加は面倒?
	それほどでもない
		と増井は思う
	便利さの方がはるかに上回る

Scrapboxと芋蔓検索

近傍検索システム
	近傍の情報をたどって目的の情報に接近
		時間的近傍
		内容的近傍
		位置的近傍
	

Scrapboxとは
	フレキシブルな共有ノート
	芋蔓的情報検索
	

デモ: Scrapbox

Scrapboxの特徴
	WYSIWYGなWiki
	複数ユーザ同時編集
	Gyazo画像の活用
	ページ代表画像の利用
	ページとタグの区別が無い
	階層構造なし
	双方向リンク
	アウトライン編集
	コード記法, コードブロック記法
	柔軟で簡単なScrapbox記法
	強力な文字装飾記法

情報整理と検索
	整理には分類が必要?
	検索できれば整理したのと同じ
	分類/階層化の必要はない
		e.g. IvySearch

情報管理の難しさ
	大量の情報を分類するのはほぼ不可能
	階層的整理は困難
		整合性の問題
		分類不能なもの
		複数カテゴリに分類したいもの

階層的情報管理
	ファイルシステムや情報整理で常識的
	分類や階層化で悩む

Evernote
	各種の「ノート」を「ノートブック」で管理
		ノートはメモでも画像でも何でも
	複数のノートブックを「スタック」で管理
	ノートに「タグ」を付加可能
	管理や分類のルールが面倒

Mindmap
	
	スプートニクとソユーズとボイジャーが全然別物になってる

Scrapbox
	ページとリンクだけを利用
	階層思考や分類思考を排除
	とにかく書いてキーワードに印をつける
	タグはページで代用する

Scrapboxの特長
	シンプルなのに強力
	あらゆる情報の芋蔓検索

例: /masuilab

例: /prog-examples

例: /masuifamily

例: /UIPedia

文献情報検索システム
	定型的な情報しか入力できない
	AとBは夫婦、とか入力できるか?

例: CGVIのサイトを生成
	http://Scrapbox.io

その他の芋蔓検索

dshelf: 書籍の芋蔓検索
	

デモ: dshelf

Pivotty: 映画の芋蔓検索
	

デモ: Pivotty

結論
	芋蔓検索の活用
	一般的な検索手法との融合が課題

#講演資料
画像キャプチャサービス「Gyazo」と関連画像検索システム

関連ページ