change linearization algorithm

daletovar · web-flow · commit fd42256fa4af · 2019-08-03T22:21:39.000-07:00
diff --git a/sparse/compressed/convert.py b/sparse/compressed/convert.py
@@ -1,62 +1,49 @@
 import numpy as np
 import numba
 
-
 def convert_to_flat(inds, shape, axisptr):
-
     inds = [np.array(ind) for ind in inds]
     if any(ind.ndim > 1 for ind in inds):
         raise IndexError('Only one-dimensional iterable indices supported.')
-    col_shapes = np.array(shape[axisptr:])
-    col_idx_size = np.prod([ind.size for ind in inds[axisptr:]])
-    col_inds = inds[axisptr:]
-    if len(col_inds) == 1:
-        return col_inds[0]
-    cols = np.empty(col_idx_size, dtype=int)
-    col_operations = np.prod(
-        [ind.size for ind in inds[axisptr:-1]]) if len(inds[axisptr:]) > 1 else 1
-    col_key_vals = np.array([int(col_inds[i][0]) for i in range(
-        len(col_inds[:-1]))] if len(col_inds) > 1 else [int(col_inds[0][0])])
-    positions = np.zeros(len(col_shapes) - 1, dtype=int)
-    cols = convert_to_2d(
-        col_inds,
-        col_key_vals,
-        transform_shape(col_shapes),
-        col_operations,
-        cols,
-        positions)
+    uncompressed_inds = inds[axisptr:]
+    cols = np.empty(np.prod([ind.size for ind in uncompressed_inds]),dtype=np.intp)
+    shape_bins = transform_shape(shape[axisptr:])
+    increments = [uncompressed_inds[i] * shape_bins[i] for i in range(len(uncompressed_inds))]
+    operations = np.prod([ind.shape[0] for ind in increments[:-1]])
+    return compute_flat(increments,cols,operations)
+    
+@numba.jit(nopython=True,nogil=True)
+def compute_flat(increments,cols,operations):
+    start = 0
+    end = increments[-1].shape[0]
+    positions = np.zeros(len(increments)-1,dtype=np.intp)
+    pos = len(increments)-2
+    for i in range(operations):
+        if i != 0 and positions[pos] == increments[pos].shape[0]:
+            positions[pos] = 0
+            pos -= 1
+            positions[pos] += 1
+            pos += 1
+        to_add = np.array([increments[i][positions[i]] for i in range(len(increments)-1)]).sum()
+        cols[start:end] = increments[-1] + to_add
+        positions[pos] += 1
+        start += increments[-1].shape[0]
+        end += increments[-1].shape[0]
     return cols
-
+        
+    
 def transform_shape(shape):
+    """
+    turns a shape into the linearized increments that 
+    it represents. For example, given (5,5,5), it returns
+    np.array([25,5,1]).
+    """
     shape_bins = np.empty(len(shape),dtype=np.intp)
     shape_bins[-1] = 1
     for i in range(len(shape)-1):
         shape_bins[i] = np.prod(shape[i:-1])
     return shape_bins
 
-
-@numba.jit(nopython=True, nogil=True)
-def convert_to_2d(inds, key_vals, shape_bins, operations, indices, positions):
-
-    pos = len(key_vals) - 1
-    increment = 0
-
-    for i in range(operations):
-        if i != 0 and key_vals[pos] == inds[pos][-1]:
-            key_vals[pos] = inds[pos][0]
-            positions[pos] = 0
-            pos -= 1
-            positions[pos] += 1
-        key_vals[pos] = inds[pos][positions[pos]]
-        pos = len(key_vals) - 1
-        positions[pos] += 1
-        linearized = ((key_vals + np.array([inds[-1][0]])) * shape_bins).sum()
-        indices[increment:increment + len(inds[-1])] =  inds[-1] + linearized - inds[-1][0]
-        increment += len(inds[-1])
-
-    return indices
-
-
 @numba.jit(nopython=True, nogil=True)
 def uncompress_dimension(indptr):
     """converts an index pointer array into an array of coordinates"""