音声周りの関数にコメントを追加

shiguredo · Jul 11, 2023 · 4239c1b · 4239c1b
1 parent 9d8cc07
commit 4239c1b
Show file tree

Hide file tree

Showing 2 changed files with 60 additions and 0 deletions.
diff --git a/src/sora_audio_sink.h b/src/sora_audio_sink.h
@@ -19,6 +19,14 @@
 
 namespace nb = nanobind;
 
+/**
+ * Sora からの音声を受け取る SoraAudioSinkImpl です。
+ * 
+ * Connection の OnTrack コールバックから渡されるリモート Track から音声を取り出すことができます。
+ * Track からの音声は SoraAudioSinkImpl 内のバッファに溜め込まれるため、任意のタイミングで音声を取り出すことができます。
+ * 実装上の留意点：Track の参照保持のための Impl のない SoraAudioSink を __init__.py に定義しています。
+ * SoraAudioSinkImpl を直接 Python から呼び出すことは想定していません。
+ */
 class SoraAudioSinkImpl : public webrtc::AudioTrackSinkInterface,
                           public DisposeSubscriber {
  public:
@@ -38,11 +46,22 @@ class SoraAudioSinkImpl : public webrtc::AudioTrackSinkInterface,
               size_t number_of_frames,
               absl::optional<int64_t> absolute_capture_timestamp_ms) override;
 
+  /**
+   * 実装上の留意点：コールバックと Read 関数の共存はパフォーマンスや使い方の面で難しいことが判明したので、
+   * on_data_, on_format_ ともに廃止予定です。
+  */
   std::function<void(
       nb::ndarray<nb::numpy, int16_t, nb::shape<nb::any, nb::any>>)>
       on_data_;
   std::function<void(int, size_t)> on_format_;
 
+  /**
+   * 受信済みのデータをバッファから読み出す
+   * 
+   * @param frames 受け取るチャンネルごとのサンプル数。0 を指定した場合には、受信済みのすべてのサンプルを返す
+   * @param timeout 溜まっているサンプル数が frames で指定した数を満たさない場合の待ち時間。秒単位の float で指定する
+   * @return Tuple でインデックス 0 には成否が、成功した場合のみインデックス 1 には NumPy の配列 numpy.ndarray で チャンネルごとのサンプル数 x チャンネル数 になっている音声データ
+   */
   nb::tuple Read(size_t frames, float timeout);
 
  private:

diff --git a/src/sora_audio_source.h b/src/sora_audio_source.h
@@ -18,6 +18,12 @@
 
 namespace nb = nanobind;
 
+/**
+ * SoraAudioSourceInterface は SoraAudioSource の実体です。
+ * 
+ * 実装上の留意点：webrtc::Notifier<webrtc::AudioSourceInterface> を継承しているクラスは
+ * nanobind で直接的な紐付けを行うとエラーが出るため SoraAudioSource とはクラスを分けました。
+ */
 class SoraAudioSourceInterface
     : public webrtc::Notifier<webrtc::AudioSourceInterface> {
  public:
@@ -55,6 +61,13 @@ class SoraAudioSourceInterface
   int64_t last_timestamp_;
 };
 
+/**
+ * Sora に音声データを送る受け口である SoraAudioSource です。
+ * 
+ * AudioSource に音声データを渡すことで、 Sora に音声を送ることができます。
+ * AudioSource は MediaStreamTrack として振る舞うため、
+ * AudioSource と同一の Sora インスタンスから生成された複数の Connection で共用できます。
+ */
 class SoraAudioSource : public SoraTrackInterface {
  public:
   SoraAudioSource(DisposePublisher* publisher,
@@ -63,15 +76,43 @@ class SoraAudioSource : public SoraTrackInterface {
                   size_t channels,
                   int sample_rate);
 
+  /**
+   * Sora に送る音声データを渡します。
+   * 
+   * @param data 送信する 16bit PCM データの参照
+   * @param samples_per_channel チャンネルごとのサンプル数
+   * @param timestamp Python の time.time() で取得できるエポック秒で表されるフレームのタイムスタンプ
+   */
   void OnData(const int16_t* data,
               size_t samples_per_channel,
               double timestamp);
+  /**
+   * Sora に送る音声データを渡します。
+   * 
+   * タイムスタンプは先に受け取ったデータと連続になっていると想定してサンプル数から自動生成します。
+   * 
+   * @param data 送信する 16bit PCM データの参照
+   * @param samples_per_channel チャンネルごとのサンプル数
+   */
   void OnData(const int16_t* data, size_t samples_per_channel);
+  /**
+   * Sora に送る音声データを渡します。
+   * 
+   * @param ndarray NumPy の配列 numpy.ndarray で チャンネルごとのサンプル数 x チャンネル数 になっている音声データ
+   * @param timestamp Python の time.time() で取得できるエポック秒で表されるフレームのタイムスタンプ
+   */
   void OnData(nb::ndarray<int16_t,
                           nb::shape<nb::any, nb::any>,
                           nb::c_contig,
                           nb::device::cpu> ndarray,
               double timestamp);
+  /**
+   * Sora に送る音声データを渡します。
+   * 
+   * タイムスタンプは先に受け取ったデータと連続になっていると想定してサンプル数から自動生成します。
+   * 
+   * @param ndarray NumPy の配列 numpy.ndarray で チャンネルごとのサンプル数 x チャンネル数 になっている音声データ
+   */
   void OnData(nb::ndarray<int16_t,
                           nb::shape<nb::any, nb::any>,
                           nb::c_contig,