我想用迈克尔饥饿的批处理进口商进口6M左右,但节点我得到这个奇怪的错误: java.lang.NumberFormatException: For input string: "78rftark42lp5f8nadc63l62r3" at java.lang.NumberFormatException.forInputString(NumberFormatException.java:65)
这是奇怪,因为78rftark42lp5f8nadc63l62r3
的是,我试图导入大型CSV文件的第一个值,其数据类型设置为字符串。
这是第一个三行该文件:
name:string:sessions labels:label timestamp:long:timestamps visitor_pid referrer_url 78rftark42lp5f8nadc63l62r3 Session 1401277353000 cd7b76ef09b498e95b35b49de2925c5f http://someurl.com/blah?t=123 dt2gshq5pao8fg7bka8fdri123 Session 1401277329000 4036ac507698e4daf2ada98664da6d58 http://enter.url.com/signup/signup.php
正如你可以在这里看到name:string:session
该列的数据类型设置为string
,为什么进口商试图解析值long
?
我完全新的Neo4j及其生态系统,所以我敢肯定,我在这里失去了一些东西。
这是我跑导入了一堆节点和关系的命令: ./import.sh \ -db-directory sessions.db \ -nodes "toImport/browser-nodes.csv.gz,toImport/country-nodes.csv.gz,toImport/device-nodes.csv.gz,toImport/ip-nodes.csv.gz,toImport/language-nodes.csv.gz,toImport/operatingSystem-nodes.csv.gz,toImport/referrerType-nodes.csv.gz,toImport/resolution-nodes.csv.gz,toImport/session-nodes.csv" \ -rels "toImport/rel-session-browser.csv.gz,toImport/rel-session-country.csv.gz,toImport/rel-session-device.csv.gz,toImport/rel-session-ip.csv.gz,toImport/rel-session-language.csv.gz,toImport/rel-session-operatingSystem.csv.gz,toImport/rel-session-referrerType.csv.gz,toImport/rel-session-resolution.csv.gz"
失败的文件中的节点列表中的最后一个toImport/session-nodes.csv
其他文件已成功由进口商进行处理。
这是内容batch.properties
文件:
dump_configuration=false
cache_type=none
use_memory_mapped_buffers=true
neostore.propertystore.db.index.keys.mapped_memory=1G
neostore.propertystore.db.index.mapped_memory=3G
neostore.nodestore.db.mapped_memory=1G
neostore.relationshipstore.db.mapped_memory=1G
neostore.propertystore.db.mapped_memory=1G
neostore.propertystore.db.strings.mapped_memory=1G
batch_import.node_index.sessions=exact
batch_import.node_index.browsers=exact
batch_import.node_index.operatingsystems=exact
batch_import.node_index.referrertypes=exact
batch_import.node_index.devices=exact
batch_import.node_index.resolutions=exact
batch_import.node_index.countries=exact
batch_import.node_index.languages=exact
batch_import.node_index.ips=exact
batch_import.node_index.timestamps=exact
有什么想法吗? 我看不出这里有什么问题,所以任何帮助将不胜感激。
编辑:我使用这个二进制: https://dl.dropboxusercontent.com/u/14493611/batch_importer_20.zip