表題の現象について、以前ブログに現象についての記事を書きましたが、対策方法が分かりましたので、それについて書き残したいと思います。 現象 Google Chromeでマイク入力の音量が勝手に下がる現象についてGoogle Meetで検証。色付きバーがマイク入力(音…
音声認識で議事録を取る場合、どうしても誤認識/誤変換が発生するので、喋ってる間だけ録音/録画ができ、後からピンポイントで録音(録画)データを再生して確認できるWebサービスを作りました。 音声認識の検知と同時に録音(録画)を開始するため、冒頭部分…
JavaScriptでGoogle翻訳を可能にしているサイトは、URLにて翻訳する言語の指定が可能とのこと。
5年ほど前に大学生が開発した「フリック入力くん」という、スマホからPCにフリック入力できるサービスが公開されてバズったのですが、今でも使えるか試したところ、どうやらリンク切れしていて利用できない様子 私が開発していた「Communication Board」と…
漫画「宇宙兄弟」の41巻に以下のようなシーンがある 「私の顔見た時のテンションの落ち具合が キレーな放物線を描くのよね」ムッタがうっかりテンションを下げてしまうこの方。どんな人物なんでしょうか…? https://t.co/1THxfDjLXR pic.twitter.com/uvPAIbX…
私が開発して公開中のWebサービス「Talk To CSV」がMr.PCという雑誌の2021年3月号にて紹介されていました。とくに掲載の連絡もなかったため、私が雑誌に掲載されたという事に気付いたのはつい最近です。(思えば「Talk To CSV」には自分の名前を入れてなかっ…
こんにちは。iwatendoです。 ライブ配信やビデオ通話サービスに、Google翻訳で複数言語の字幕を付けれる仕組みを作ってみたので紹介します。 youtu.be 同時多言語翻訳のやり方について 表題に書いた通り、Talk To CSV + OBS + Google翻訳を使用してます。 Ta…
こんにちは iwatendo です。 YouTube Live や Twitch配信で Talk To CSV を使ってくれている、もなかえりさんから以下のような相談を頂いたので、今日はちょっとそれについて書いていきます。 IwatendoさんのTalk to CSVと、コリンちゃんのTalk 2 SL chatと…
こんにちは iwatendoです。 表題の件について以前もブログ記事を書きましたが、今回は具体的な使い方を説明していきたいと思います。 音声入力で字幕を付けたYouTube Live配信 実際に OBS+Talk To CSV で字幕を付けたLive配信を「もなか えり」さんがやって…
こんにちはiwatendoです。 自分が開発しているWebサービス(Talk To CSV)で表題のような現象が発生してました。原因を調査したところ、どうやらJavaScript内で getUserMediaでAudio情報(マイク情報)を取得した状態で、マイクの入力音量がゲージを振り切った…
こんにちは iwatendoです。 絵文字自体はUnicodeに含まれているものですが、TwitterやFacebook等のSNSに表示される絵文字や、iPhoneやAndroid端末で見た場合の絵文字画像が違って見える事があります。これは各プラットホーム側で独自の絵文字を作っていてそ…
こんにちは iwatendoです。 YouTube Live等のライブ配信にて、音声認識で字幕を表示する方法はいくかあると思うのですが、今日はOBS Studio + 私が開発しているTalk To CSVというサービスを利用してYouTube Liveに字幕を表示する方法を紹介したいと思います…
何年か前に映画「聲の形」を見て号泣した事をきっかけに、作ってみたサービスを紹介したいと思います。 始めに このサービスは以下のような用途を想定しています。 喋れない人が誰かに言葉を伝えるためのツールとして 耳が遠い人に言葉を伝えるためのツール…
こんにちは。iwatendoです。 Googleドキュメントで音声入力ができる事は有名だと思いますが、自作した音声入力チャットツール(Talk To CSV)に比べて、どれくらいの音声入力での変換精度に違いがあるか検証してみました。 「Talk To CSV」は Web Speech API …
こんにちは。iwatendoです。 以前作ったサービスを少し改良して、名前を変えました。 skybeje.net 基本的な使い方は変わってないので、詳細は前回記事を参照願います。 iwatendo.hateblo.jp その他、細かい部分をちょこちょこ改善しています。 ・変換途中の…
こんにちは iwatendoです。 今日はSkybejeというサービスに実装している機能の内、スマホのWebカメラ映像をPC上に表示する機能を紹介します。(この機能も Skyway を使用しています) アプリのインストールやアカウント登録は不用で、以下のページのQRコード…
現在、音声通話やビデオ通話が可能なサービスは多数存在するのですが、会話の内容を音声認識で字幕表示したり、テキストとして残せるサービスはそれほど多くないように思います。(現状だと英語のみ対応というケースが多い気がします) そのため、音声通話や…
こんにちは。iwatendoです。今日は個人開発しているチャットツールの基本的な使い方を書いていきます。 起動方法 以下のサイトを開くだけで起動します (PC版のChrome専用) skybeje.net 上記ページはあくまでチャットサーバーの役割を担ってるだけなので、…
始めに この記事は以下のような人向けです。 PC(Windows)で、SlackやDiscordを使用している人 ビデオ/音声通話の参加時に、テキスト入力した内容を音声合成で喋らせたい人(別アプリにテキスト入力した内容を音声合成します。SlackやDiscordにテキスト入…
開発しているサービスでIndexedDBを使用しているのですが、現状のChromeの場合、どのくらいまでの容量を登録できるのか、また限界までデータ登録した場合、どのような動きになるのか不明だった為、検証してみました。 IndexedDB 2.0とは ブラウザに実装され…
はじめに 表題の件について、現象は以前から認識していたのですが、ブラウザ側の問題と認識していて保留にしてました。 TK (@TK11235)さんが開発している、ユドナリウムでもデータ送信速度が遅くなる現象が発生する様子で、ちょっと気になったので原因を調査…
はじめに SkyWayを使ったWebサービスを開発する際に、SkyWayのコンソールで「利用可能ドメイン」を指定すると思いますが、私は暫くドメインを跨いでの接続はできないと勘違いしていました。 ドメインを跨いで接続できる事により、様々な方法でデバックできる…
先日書いた記事の追記になります。 端末毎のCodecの確認方法についてSDPで判断できます。という情報をTwitterで頂きました。 SDP自体は何となく聞いた事があったので、なるほどと思い、早速確認してみようと思ったのですが、skyway.js の APIリファレンスを…
少し前に、iOS11のSafariがWebRTCに対応したので、iPhoneでのWebRTCの動作検証も兼ねて、前から作ってみようと思っていたSkyWay+GoogleMapのサービスを作ってみました。 ~ 現場から中継お願いします!~ パソコンで上記のページを開いて、QRコードをスマート…
グループ通話またはライブ配信する際に、チャット入力した文章を音声合成してマイクに流す仕組みを作ってみました。 基本的には、開発中のSkyBeje用に作ってみた仕組みですが、SkypeやDiscordの音声通話にも応用できると思います。 2020.04.30 追記 SlackやD…
9月29日に上野で開催された、表題のイベントに参加してきました。復習も兼ねて、各種資料やまとめのリンクを集めてみました。以下、SkyWay Developers Meetup #1 で、発表時に使われたスライド資料です。 SkyWayの目指す世界 SkyWayを使いこなすために LT : …
開発中のチャットサービスに、YouTubeの同期再生機能を実装してみました。 YouTube同期再生のテスト動画。ちょっと暗くてわかりづらいですが、3台のPCをSkybejeで繋いでいます。左上の一番小さなYouTubeの画面の操作で、各PCのYouTube動画が連動して再生・…
9月7日にSkyWayが正式サービスになりましたね。 webrtc.ecl.ntt.com 私自身、2年近くトライアルで使わせて頂いてて、遂に来たかという想いです。正式サービスといっても、個人での開発やOSSで展開するよう場合は、実質今まで通り無料で使わせて頂けるようで…