Somehow this does not work for me, see log of failing unittests at the bottom.

I tried it interactively also:

In [1]: cpaste
Pasting code; enter '--' alone on the line to stop or use Ctrl-D.
:from pandas import DataFrame
:df = DataFrame({u'c/\u03c3':[1,2,3]})
:--

In [2]: print df.to_string()
---------------------------------------------------------------------------
UnicodeEncodeError                        Traceback (most recent call last)
...
UnicodeEncodeError: 'latin-1' codec can't encode character u'\u03c3' in position 2: ordinal not in range(256)

In [3]: df
Out[3]: ---------------------------------------------------------------------------
UnicodeEncodeError                        Traceback (most recent call last)
...
UnicodeEncodeError: 'latin-1' codec can't encode character u'\u03c3' in position 2: ordinal not in range(256)

In [4]: print u'c/\u03c3'
---------------------------------------------------------------------------
UnicodeEncodeError                        Traceback (most recent call last)
/projects/hardware/users/wovermei/sandbox/pandas/sandbox/<ipython-input-4-45529fc7c4b5> in <module>()
----> 1 print u'c/\u03c3'

UnicodeEncodeError: 'latin-1' codec can't encode character u'\u03c3' in position 2: ordinal not in range(256)

In [5]: import sys

In [6]: sys.stdin.encoding
Out[6]: 'ISO-8859-1'

ERROR: test_to_string_repr_unicode (pandas.tests.test_frame.TestDataFrame)
----------------------------------------------------------------------
Traceback (most recent call last):
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/tests/test_frame.py", line 1823, in test_to_string_repr_unicode
    df.to_string(col_space=10, buf=buf)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/frame.py", line 969, in to_string
    formatter.to_string()
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/format.py", line 195, in to_string
    fmt_values = self._format_col(c)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/format.py", line 248, in _format_col
    formatter)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/format.py", line 429, in _format_fixed_width
    formatted = [formatter(x) for x in values]
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/format.py", line 226, in formatter
    col_width=col_width)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/common.py", line 603, in _format
    return _just_help('%s' % _stringify(s))
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/common.py", line 512, in _stringify
    return '%s' % console_encode(col)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/common.py", line 823, in console_encode
    return value.encode(sys.stdin.encoding)
UnicodeEncodeError: 'latin-1' codec can't encode character u'\u03c3' in position 0: ordinal not in range(256)

======================================================================
ERROR: test_to_string_unicode_columns (pandas.tests.test_frame.TestDataFrame)
----------------------------------------------------------------------
Traceback (most recent call last):
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/tests/test_frame.py", line 1832, in test_to_string_unicode_columns
    df.to_string(buf=buf)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/frame.py", line 969, in to_string
    formatter.to_string()
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/format.py", line 189, in to_string
    str_columns = self._get_formatted_column_labels()
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/format.py", line 370, in _get_formatted_column_labels
    fmt_columns = self.columns.format()
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/index.py", line 269, in format
    result.extend(_stringify(x) for x in self)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/index.py", line 269, in <genexpr>
    result.extend(_stringify(x) for x in self)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/common.py", line 512, in _stringify
    return '%s' % console_encode(col)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/common.py", line 823, in console_encode
    return value.encode(sys.stdin.encoding)
UnicodeEncodeError: 'latin-1' codec can't encode character u'\u03c3' in position 0: ordinal not in range(256)

======================================================================
ERROR: test_to_string_with_formatters_unicode (pandas.tests.test_frame.TestDataFrame)
----------------------------------------------------------------------
Traceback (most recent call last):
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/tests/test_frame.py", line 1841, in test_to_string_with_formatters_unicode
    result = df.to_string(formatters={u'c/\u03c3': lambda x: '%s' % x})
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/frame.py", line 969, in to_string
    formatter.to_string()
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/format.py", line 189, in to_string
    str_columns = self._get_formatted_column_labels()
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/format.py", line 370, in _get_formatted_column_labels
    fmt_columns = self.columns.format()
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/index.py", line 269, in format
    result.extend(_stringify(x) for x in self)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/index.py", line 269, in <genexpr>
    result.extend(_stringify(x) for x in self)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/common.py", line 512, in _stringify
    return '%s' % console_encode(col)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/common.py", line 823, in console_encode
    return value.encode(sys.stdin.encoding)
UnicodeEncodeError: 'latin-1' codec can't encode character u'\u03c3' in position 2: ordinal not in range(256)

======================================================================
ERROR: test_repr_unicode (pandas.tests.test_series.TestSeries)
----------------------------------------------------------------------
Traceback (most recent call last):
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/tests/test_series.py", line 752, in test_repr_unicode
    repr(s)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/series.py", line 558, in __repr__
    name=True)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/series.py", line 596, in _get_repr
    return formatter.to_string()
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/format.py", line 118, in to_string
    fmt_values = self._get_formatted_values()
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/format.py", line 105, in _get_formatted_values
    fmt_values.append(' %s' % self.formatter(v))
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/format.py", line 58, in formatter
    col_width=col_width)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/common.py", line 603, in _format
    return _just_help('%s' % _stringify(s))
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/common.py", line 512, in _stringify
    return '%s' % console_encode(col)
  File ".../lib/python2.7/site-packages/pandas-0.7.0.dev_b4ca18b-py2.7-linux-x86_64.egg/pandas/core/common.py", line 823, in console_encode
    return value.encode(sys.stdin.encoding)
UnicodeEncodeError: 'latin-1' codec can't encode character u'\u03c3' in position 0: ordinal not in range(256)

Uh oh!

Cannot print DataFrame with unicode columns in IPython #680

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions