apache · assignUser · Jan 17, 2023 · Jan 5, 2023 · Jan 5, 2023 · Jan 5, 2023
diff --git a/cpp/src/arrow/array/array_list_test.cc b/cpp/src/arrow/array/array_list_test.cc
@@ -509,6 +509,18 @@ class TestListArray : public ::testing::Test {
     ASSERT_RAISES(Invalid, ValidateOffsets(2, {0, 7, 4}, values));
   }
 
+  void TestSliced() {
+    auto arr = ArrayFromJSON(list(int16()), "[[1, 2], [3, 4, 5], [6], [7, 8]]");
+
+    auto arr_sliced = arr->Slice(0, 2);
+    auto expected_sliced = ArrayFromJSON(list(int16()), "[[1, 2], [3, 4, 5]]");
+    AssertArraysEqual(*expected_sliced, *arr_sliced);
+
+    auto values = checked_cast<ListArray*>(arr_sliced.get())->values();
+    auto expected_values = ArrayFromJSON(int16(), "[1, 2, 3, 4, 5]");
+    AssertArraysEqual(*expected_values, *values);
+  }
+
   void TestCornerCases() {
     // ARROW-7985
     ASSERT_OK(builder_->AppendNull());
@@ -601,6 +613,8 @@ TYPED_TEST(TestListArray, TestFlattenNonEmptyBackingNulls) {
 
 TYPED_TEST(TestListArray, ValidateOffsets) { this->TestValidateOffsets(); }
 
+TYPED_TEST(TestListArray, TestSliced) { this->TestSliced(); }
+
 TYPED_TEST(TestListArray, CornerCases) { this->TestCornerCases(); }
 
 #ifndef ARROW_LARGE_MEMORY_TESTS

diff --git a/python/pyarrow/src/arrow/python/arrow_to_pandas.cc b/python/pyarrow/src/arrow/python/arrow_to_pandas.cc
@@ -737,6 +737,7 @@ Status ConvertListsLike(PandasOptions options, const ChunkedArray& data,
   // Get column of underlying value arrays
   ArrayVector value_arrays;
   for (int c = 0; c < data.num_chunks(); c++) {
+    // Values does not account for offsets
     const auto& arr = checked_cast<const ListArrayT&>(*data.chunk(c));
     if (arr.value_type()->id() == Type::EXTENSION) {
       const auto& arr_ext = checked_cast<const ExtensionArray&>(*arr.values());

diff --git a/python/pyarrow/tests/test_pandas.py b/python/pyarrow/tests/test_pandas.py
@@ -4513,3 +4513,16 @@ def test_does_not_mutate_timedelta_nested():
     df = table.to_pandas()
 
     assert df["timedelta_2"][0].to_pytimedelta() == timedelta_2[0]
+
+
+def test_list_only_once():
+    breakpoint()
+    arr = pa.array([[1, 2], [3, 4, 5], [6], [7, 8]])
+    chunked_arr = pa.chunked_array([arr.slice(0, 2), arr.slice(2, 2)])
+
+    # converting this chunked array to numpy
+    np_arr = chunked_arr.to_numpy()
+
+    expected_base = np.array([[1, 2, 3, 4, 5, 6, 7, 8]])
+    assert np_arr[0].base == expected_base
+    assert arr.to_numpy(zero_copy_only=False)[0].base == expected_base