做我的研究,但没有找到这样的东西。 我想一个简单的转换pandas.DataFrame
到火花数据框,如下所示:
df = pd.DataFrame({'col1': ['a', 'b', 'c'], 'col2': [1, 2, 3]})
sc_sql.createDataFrame(df, schema=df.columns.tolist())
我得到的错误是:
TypeError: Can not infer schema for type: <class 'str'>
我试过的东西更简单:
df = pd.DataFrame([1, 2, 3])
sc_sql.createDataFrame(df)
而我得到:
TypeError: Can not infer schema for type: <class 'numpy.int64'>
任何帮助吗? 难道需要手动指定架构或这样的吗?
sc_sql
是pyspark.sql.SQLContext
,我在蟒蛇3.4 jupyter笔记本电脑,引发1.6。
谢谢!