JavaEE7をはじめよう(20) - WebSocket - デコーダとエンコーダ - エンタープライズギークス (Enterprise Geeks)

前回の記事では WebSocket の基本的な実装方法を示した。

WebSocket を用いて本格的なアプリケーションを作る場合、メッセージの送受信をどのように行うかが課題となる。WebSocket には、HTML の FORM のように、構造的なデータを送る仕組みはない。このため、多種多様なデータをやり取りする際には、文字列やバイナリをプログラムで扱いやすいように変換する必要がある。

今回は、チャットアプリケーションを題材として、Java EE WebSocket API のデータ変換の仕組みであるデコーダとエンコーダを解説する。

チャットアプリケーション

サンプルのチャットアプリケーションはこちらで公開しているのでアクセスしてみていただきたい。（前回と同様に、アプリケーションの起動に時間がかかる場合があるため、アクセス時にエラーとなる場合は、しばらく待ってから再度アクセスしていただきたい）。

このアプリケーションでは、各自が名前を設定して、メッセージや画像ファイルを送受信できる。そのため、アプリケーションではバイナリと4種類のテキストをやり取りできるようにしている。

種類	内容	送信データ
Ping	サーバーとの疎通確認。	文字列 `"Ping"`
メッセージ	名前とメッセージの内容。送受信される。	JSON `{name:"", message:""}`
文字列	JSON以外の文字列。	任意の文字列
画像ファイル	画像ファイルを全クライアントに送信する	バイナリ
ファイル情報	画像ファイルの情報	JSON `{name:"", fileName:"", type:""}`

文字列で構造化データを扱うために、JSON 形式を採用した。

では、サーバー側でこれらのメッセージの種類を見分け、かつプログラムで扱いやすくするにはどうすればよいだろうか。（ちなみに、テキストとバイナリの区別だけなら、前回の記事で紹介したように WebSocket API で行える。）

サーバーエンドポイントの@OnMessageメソッドで文字列を解析してメッセージを判別すると煩雑になってしまう。このような時に、デコーダとエンコーダを使用すると良い。

このアプリケーションで扱うテキストメッセージは4種類なので（バイナリはデコーダを通さずそのまま扱うのでここでは関係ない）、デコードした型に対応するメソッドも4つ定義したい。このため、上記のコードではonMessageToBroadCast, onPingMessage, onInvalidMessage, onUploadFileの4つのメソッドを定義した。可能なら、それらのメソッドに@OnMessageアノテーションを指定して、デコードしたオブジェクトの型に対応したメソッドが実行されるとよいのだが、残念ながらそれは仕様上できない。これは、前回の記事にも書いたように@OnMessageを設定できるメソッドは、テキストとバイナリでそれぞれ1つだけだからだ。

よってその対策として、TextBaseというマーカーインターフェースを作成して、デコード対象のすべての型で実装するようにした。これにより、4種類のいずれかのデコーダで変換されたオブジェクトは全てTextBase型で扱えるので、上記のTextBaseを引数にとる@OnMessageメソッドが呼び出される。

そしてメソッド内では、実際の型をinstanceofで判定して、対応するメソッドを呼び出している。

onMessageToBroadCastの実装は以下の通りだ。

    /** 各クライアントに、メッセージを送信する */
    // 本当はここに、@OnMessageを付けたかった。
    public void onMessageToBroadCast(Message message, Session client) 
              throws IOException, EncodeException {
        // Encoderの設定に基づいて、適切な変換が行われる。
        for(Session other : client.getOpenSessions()) {
            other.getAsyncRemote().sendObject(message);
        }
    }

チャットアプリケーションなので、ここでは受信したメッセージを各クライアントに同報している。

前回の記事のコードでは、リモートエンドポイントに対して、setTextメッセージを呼び出していたが、今回はこの後で説明するエンコーダを利用するために、Message型の変数を渡してsendObjectメソッドを呼び出している。

WebSocket はテキストとバイナリの送受信しかできないため、sendObjectで渡したオブジェクトも何らかの方法でテキストかバイナリに変換する必要がある。

ここで登場するのが、エンコーダである。

エンコーダ

エンコーダはデコーダの逆であり、 Javaのオブジェクトをテキストやバイナリデータに変換する仕組みである。

エンコーダの定義

エンコーダは、javax.websocketパッケージのEncoder.TextまたはEncoder.Binaryを実装して作成する。Textは文字列への変換で、Binaryはバイナリへの変換である。

Messageクラスに関するエンコーダのコードの一部を以下に示す。ソースの全体はこちらにある。

public abstract class Encoders {
    // 1. 初期化・破棄は何もしないデフォルト実装とする。
    private static abstract class BaseTextEncorder<T> 
　　　　　　　implements Encoder.Text<T> {
        @Override
        public void destroy() {}

        @Override
        public void init(EndpointConfig config) {}
        
        protected String toMessageJson(String name, String message) {
            StringWriter w = new StringWriter();
            JsonGenerator gen = Json.createGenerator(w);
            gen.writeStartObject()
                .write("name", name)
                .write("message", message)
                .writeEnd().close();
            return w.toString();
        }
    }
    // 2. メッセージクラスのエンコーダ
    public static class MessageEncoder 
　　　　　　　　　　　　　　　extends BaseTextEncorder<Message> {
        @Override
        public String encode(Message message) throws EncodeException{
            return toMessageJson(message.name, message.message);
        }
    }
// 割愛

1.では、デコーダと同様に、共通処理を持たせたBaseTextEncoderを基底クラスとして定義している。

2.がMessageクラスのエンコーダで、encodeメソッドを実装している。encodeメソッドでは JSON API を用いて、{name:"", message:""}となる JSON 文字列を生成している。

ここで生成した文字列が、実際にクライアントに送信される内容になる。

エンコーダの利用

デコーダと同じく、@ServerEndpointアノテーションのencoders属性に指定する。以下にエンドポイントの定義を再掲する。

@ServerEndpoint(value="/websocket_sample",
        decoders = {
           Decoders.PingDecoder.class, 
           Decoders.MessageDecoder.class, 
           Decoders.FileAttrDecoder.class, 
           Decoders.TextDataDecoder.class},
        encoders = { /* エンコーダ定義 */
           Encoders.MessageEncoder.class, 
           Encoders.FileAttrEncorder.class})
@Dependent
public class WebSocketSampleEndPoint {
// 割愛

デコーダの場合、テキストとバイナリのそれぞれで1つしか定義できないため、複数のデコーダに対応させるための工夫が必要だったが、エンコーダは特別な工夫なしに何種類でも定義できる。

これは、デコーダがテキストおよびバイナリからのオブジェクト変換なのに対して、エンコーダはオブジェクトからテキストやバイナリへの変換であるためだ。

送信処理では、sendObjectメソッドが呼び出されると、内部で@ServerEndpointアノテーションのencoders属性に指定したエンコーダを探し、sendObjectの引数の型と一致するエンコーダのencodeメソッドを呼び出す仕組みになっている。

デコーダ、エンコーダの処理の流れ

ここで、デコーダ、エンコーダ、サーバエンドポイントのシーケンス図を示しておく。

まずは、メッセージの受信時である。

f:id:enterprisegeeks:20151208193253p:plain

次がメッセージの送信時である。

f:id:enterprisegeeks:20151208193300p:plain

このように、デコータ、エンコーダを介したデータ変換は、サーバーエンドポイントの受信と送信処理の途中で行われる。

クライアント側の実装

クライアント側では、文字列として JSON を受け取るので、JSON への変換処理を行い、DOM 操作を行っている。特筆すべき内容はないので、ソースへのリンクのみを示しておく。

クライアント側のJavaScriptのコード

テキストとバイナリをまとめて送信したい場合の対応

WebSocket は、テキストとバイナリを区別して送る。

そのため、画像ファイルをバイナリで送信する場合、ファイル名などの情報は同時には送れない。

今回のアプリケーションでは画像送信を行う際に、バリナリファイルの情報を得るために以下の2つのメッセージを送るようにした。

ファイル情報の JSON 文字列（{name:"送信者", fileName:"ファイル名", type:"ファイルのMIME"}）
ファイルのバイナリそのもの

サーバー側では、ファイル情報が到着したら、サーバーエンドポイントのインスタンスフィールドに保持しておく。次に、ファイルのバイナリが着いたら、まずファイル情報のメッセージを送信して、次にバイナリを送信している。

簡単な方法なので、この方式を採用したが、以下の課題がある。

サーバーエンドポイントで、2つのメッセージを受けてから処理を実行するといったステートを管理している。（サーバーエンドポイントはクライアントごとにインスタンスが作成されるのでステートを持つことは問題ないが、コードやテストが複雑になるためできればステート管理はしたくない）。
2つのメッセージが、ファイル情報、バイナリの順で来ることを前提にしてしまっている（送信においても同様）。

きちんと対処するなら、ファイル情報とバイナリを1つのメッセージに載せるしかないだろう。

その場合には、次のいずれかの方法を採る必要がある。

ファイルを Base64 エンコードして、テキストデータに載せて送る
バイナリデータにファイルのバイナリとファイル情報を書き込んで送る

どちらにしても、受信データからテキスト部分とバイナリ部分を分割する処理が必要になる。今回は実装しなかったが、確実性を求めるなら検討する必要があるだろう。

まとめ

今回はデコーダとエンコーダを紹介した。この仕組みを利用すると面倒なデータ変換処理を外出しできるので、WebSocket でアプリケーションを作るなら導入した方がよいだろう。

次回はサーバー側からのプッシュ送信について解説する。

[前多賢太郎]

エンタープライズギークス (Enterprise Geeks)

企業システムの企画・開発に携わる技術者集団のブログです。開発言語やフレームワークなどアプリケーション開発に関する各種情報を発信しています。ウルシステムズのエンジニア有志が運営しています。

JavaEE7をはじめよう(20) - WebSocket - デコーダとエンコーダ