final changes

koaning · koaning · Aug 9, 2023 · Aug 9, 2023 · Aug 9, 2023 · Aug 9, 2023
commit e449a35447cd8bc0307899048ac1efc236d59271
diff --git a/docs/API/text.md b/docs/API/text.md
@@ -4,12 +4,6 @@
     options:
         members: false
 
-## BytePairEncoder
-
-::: embetter.text.BytePairEncoder
-    options:
-        members: false
-
 ## KerasNLPEncoder
 
 ::: embetter.text.KerasNLPEncoder
@@ -27,3 +21,17 @@
 ::: embetter.text.Sense2VecEncoder
     options:
         members: false
+
+## BytePairEncoder
+
+::: embetter.text.BytePairEncoder
+    options:
+        members: false
+
+
+## GensimEncoder
+
+::: embetter.text.GensimEncoder
+    options:
+        members: false
+
diff --git a/embetter/text/__init__.py b/embetter/text/__init__.py
@@ -21,10 +21,11 @@
     spaCyEncoder = NotInstalled("spaCyEncoder", "spacy")
 
 try:
-    from embetter.text._word2vec import Word2VecEncoder
+    from embetter.text._word2vec import GensimEncoder
 except ModuleNotFoundError:
-    Word2VecEncoder = NotInstalled("Word2VecEncoder", "gensim")
+    GensimEncoder = NotInstalled("GensimEncoder", "gensim")
 
+try:
     from embetter.text._keras import KerasNLPEncoder
 except ModuleNotFoundError:
     KerasNLPEncoder = NotInstalled("KerasNLPEncoder", "keras_nlp")
@@ -35,6 +36,6 @@
     "Sense2VecEncoder",
     "BytePairEncoder",
     "spaCyEncoder",
-    "Word2VecEncoder",
+    "GensimEncoder",
     "KerasNLPEncoder",
 ]
diff --git a/embetter/text/_word2vec.py b/embetter/text/_word2vec.py
@@ -8,7 +8,7 @@
 from embetter.base import EmbetterBase
 
 
-class Word2VecEncoder(EmbetterBase):
+class GensimEncoder(EmbetterBase):
     """
     Encodes text using a static word embedding model. The component uses gensim's default tokenizer.
 

diff --git a/tests/test_text.py b/tests/test_text.py
@@ -10,7 +10,7 @@
 from embetter.text import (
     BytePairEncoder,
     SentenceEncoder,
-    Word2VecEncoder,
+    GensimEncoder,
     spaCyEncoder,
 )
 from embetter.utils import cached
@@ -30,15 +30,15 @@ def test_word2vec(setting):
     model = Word2Vec(
         sentences=sentences, vector_size=vector_size, window=3, min_count=1
     )
-    encoder = Word2VecEncoder(model, agg=setting)
+    encoder = GensimEncoder(model, agg=setting)
     output = encoder.fit_transform(test_sentences)
     assert isinstance(output, np.ndarray)
     out_dim = vector_size if setting != "both" else vector_size * 2
     assert output.shape == (len(test_sentences), out_dim)
     # This tests whether it can load the model from disk
     with tempfile.NamedTemporaryFile() as fp:
         model.save(fp)
-        encoder = Word2VecEncoder(fp.name, agg=setting)
+        encoder = GensimEncoder(fp.name, agg=setting)
         encoder.transform(test_sentences)
     assert repr(encoder)