机器翻译 - attention weight的heap map如下图。该功能有现成的evaluator可以直接调用。  - beam search希望得到每个词的概率,用于自定义剪枝 #1135 。该功能需要改c++代码,但工作量不大。 - decoding每一步解码都能展示。该功能实现工作量很大,同时展示时beam size得小,且选择短句子。