背景:
我知道这太问题有关事务性NTFS(TxF的)和本文描述如何使用它,但我正在寻找现实世界的经验 ,具备相当高容量企业系统中大量的BLOB数据(比如文件和/或照片)需要进行一次事务持续多次读取 。
- 我们期待一个几万每天书面文件和数万每小时的读取。
- 我们可以在文件系统中或在SQL服务器或者存储索引,但必须能够在几个箱子扩展了这一点。
- 我们必须保持轻松备份和恢复数据的灾难恢复能力。
问题:
- 任何现实世界中,企业级事务性NTFS(TxF的)经验?
相关的问题:
- 任何试图使用TxF的在同一个文件致力于两个镜像服务器在一次分布式事务?
- 任何人试图与文件系统和数据库的分布式事务?
- 任何你可以分享性能问题/可靠性问题/性能数据? 有没有人,即使做了如此规模之前,其中交易是一个问题?
编辑 :要更清楚,我已经研究了其他技术,包括SQL Server 2008新的FILESTREAM数据类型,但这个问题是specificially针对仅事务文件系统 。
更多资源:
- 在TxF的一个MSDN杂志一篇名为“提升您的应用程序使用文件系统事务” 。
- 所谓的网络广播“:内核事务管理和朋友(TxF的,TxR还)交易Vista的” 。 此视频引述使用的2-5%TxF的,起步价在25分钟内的表现讨论的开销。这是第一套硬数字,我发现。 而视频是如何工作的引擎盖下了很好的概述。 在大约34:30,扬声器描述了一个非常类似的情景了这个问题。
- 一个第9频道截屏称为“苏伦德拉维尔马:Vista的事务性文件系统” 。 他谈论起在大约35分钟的表现,没有确凿的数据。
- 名单TxF的文章在B#.NET博客。
- 一个第9频道截屏被称为“事务性NTFS” 。
我想,“现实世界,企业级”的体验是比较主观的比它的声音。
Windows更新使用TXF。 因此,它被用来相当严重的频率方面。 现在,它是没有做任何多节点的工作,它不是通过DTC或任何幻想这样的打算,但它使用TXF操作文件的状态。 它协调这些变化对注册表的更改(TXR)。 这是否算?
我的一位同事提出这个谈话SNIA ,这是非常坦率地谈了很多工作都是围绕TXF的,并可能摆脱多一点光。 如果你想使用TXF的,这是值得一读。
不幸的是,看起来,答案是“否”。
在近两周(一周有100点奖金)和156点的观点,没有人回答,因为我描述了他们使用TxF的任何大批量应用。 我不能说这是意外,当然我不能证明负面的,但现在看来此Windows功能并不为人熟知的或经常使用,至少通过在写作时的SO社区的活跃成员。
如果我得到周围写某种概念验证的,我会张贴在这里我学习。
你有没有考虑FILESTREAM支持在SQL Server 2008(如果你使用的过程中的SQL Server 2008)? 我不知道有关性能,但它提供了事务性和支持备份/恢复。
虽然我没有与TxF的广泛experienve,我也有MS DTC经验。 TxF的本身是相当高性能的。 当你在MS DTC扔在多台计算机来处理多个资源管理器,性能需要相当的打击。
从你的描述,这听起来像您存储和非结构化数据的索引非常大的量。 我假设你也需要搜索这个数据的能力。 因此,我强烈建议寻找到类似微软的树妖或谷歌的MapReduce和高性能的分布式文件系统来处理你的非结构化数据存储和索引。 存储高容量企业系统和BLOB数据的索引海量的最好的例子是像Bing和谷歌的互联网搜索引擎。
有可用于管理高吞吐量非结构化数据相当多的资源,他们可能会更有效地解决您的问题比SQL Server和NTFS。
我知道它有点远开箱即比你可能寻找......但你没有提到你已经耗尽周围的NTFS / TxF的/ SQL中的所有其它的搜索途径。 ;)
罗纳德:的FileStream层叠在TxF的顶部。
JR:虽然Windows Update使用TxF的/ KTM并演示了它的实用性,它不是一个高吞吐量应用。