我已经建立了具有我想与搜索结果一起呈现的图像的图像缩略图URL的SOLR指数。 问题是,这些图像可以运行到数以百万计,我认为存储图像索引作为二进制数据将使指数堆积如山。
我是从网址,使它们寻求后,如何有效地存储这些图像的指导,我应该使用普通的文件系统,并让他们通过tomcat的渲染,或者我应该使用JCR仓库,比如Apache兔崽子?
任何指导,将不胜感激。
谢谢。
我已经建立了具有我想与搜索结果一起呈现的图像的图像缩略图URL的SOLR指数。 问题是,这些图像可以运行到数以百万计,我认为存储图像索引作为二进制数据将使指数堆积如山。
我是从网址,使它们寻求后,如何有效地存储这些图像的指导,我应该使用普通的文件系统,并让他们通过tomcat的渲染,或者我应该使用JCR仓库,比如Apache兔崽子?
任何指导,将不胜感激。
谢谢。
我想,最后才决定如何坚持图像评估有效requiriments。
你需要的版本? 您是否计划eonly搅拌图像或其他元数据? 你有在水平缩放什么要求吗? 你需要的任何图像处理或缩放? 你需要访问图像metatdata? 你需要管理的图像额外的工具? 你愿意在学习额外的技术投入时间?
存储在文件系统上,并使其可通过图像sppoler实现的是坚持你的图片最简单的方式。 但是,如果你确定一些的上述要求(这是典型的内容回购或坝系统),然后将最终重塑与文件系统的方式轮。
另一种选择是使用一种内容存储库。 一个JCR回购例如像兔崽子或它的商业实现CRX是一个选项。 露天(支持CMIS)将是另一个有效。 喜欢的版本,后期处理(缩放...),元数据提取和管理功能只被提到的两个仓库解决方案的支持。 但是,这需要你学习一门新技术,它可以是耗时。 提到的两个仓库的技术可能会很复杂。 如果横向扩展是一个要求,因为communty版本缺少这个功能,我会考虑商业支持的存储库实现(CRX或露天企业)。
我个人而言,我真的取决于上述要求的任何决定。 我广泛地与兔崽子,CRX和露天CE和EE工作,亲自我会去的露天因为我经历过用大量的数据更好的扩展。
我不知道适合您的具体需要的图像池解决方案,但它不应该是难以实现的,除了一个事实,即反复缩放操作可以非常耗费资源。
我会去下面的方法,如果FS是足以让你:
如果您计划存储数百万的图像,然后避免把所有文件在同一目录。 浏览平板层次有两个多条目将是一场噩梦。 更好地创造,即通过一个树形结构反转当前日期时间(年/月/日/小时/分钟...... 2013/06/01/08/45)。
这可以确保拿到最后一个文件夹内的文件的数量不要太大(露天使用相同的模式存储在FS二进制对象,它已proofen很好地工作)。