anytxt/release
收藏Hugging Face2023-03-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/anytxt/release
下载链接
链接失效反馈官方服务:
资源简介:
# AnyTXT Searcher
------
AnyTXT Searcher is a powerful local data full-text search engine, just like a local disk Google search engine. It is your free Google Desktop Search alternative.
AnyTXT Searcher has a powerful document parsing engine built in, which extracts the text of commonly used documents/images(OCR) without installing any other software, and combines the built-in high-speed indexing system to store the metadata of the text. You can quickly find any text that exists on your computer with the AnyTXT Searcher. It works on Windows 11, 10, 8, 7, Vista, XP(below 1.2.540), 2003, 2008, 2012, 2016, 2022 ...
### [Download Installer](https://anytxt.net/download/)
### [More ... ](https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=57&ved=2ahUKEwiqx4jT-JvmAhWDJjQIHUJhB6Y4MhAWMAZ6BAgIEAE&url=https%3A%2F%2Fanytxt.net%2F&usg=AOvVaw22wtPNrBgzzwvh2hRvZm9I)
### Formats Supported
> * Plain Text Format (txt, cpp, html etc.)
> * Microsoft Word (doc, docx)
> * Microsoft Excel (xls, xlsx)
> * Microsoft PowerPoint (ppt, pptx)
> * Microsoft OneNote (one)
> * Portable Document Format (pdf)
> * eBook Format (epub, mobi, djvu, chm, fb2, azw(3) etc.)
> * WPS Word Format (wps)
> * WPS Excel Format (et)
> * WPS PowerPoint Format (dps)
> * Open Document Format (OpenOffice, LibreOffice etc.)
> * Mind Map Format (lighten, mmap, mm, xmind etc.)
> * Open Fixed-layout Document Format (ofd)
> * Edraw Max Format (eddx)
> * WizNote Format (ziw)
> * Image Format (jpg, png, bmp, gif etc.)
> * Binary File (exe, dll, so)
> * More Document Types please let us know
### More Features
> * Microsoft Office (doc, xls, ppt) Full Text Index Supported
> * Microsoft Office 2007 (docx, xlsx, pptx, docm, xlsm, docm) Full Text Index Supported
> * Multi-language(include Chinese,Japanese,Korean) Document Full Text Index Supported
> * WPS Office (wps, et, dps) Full Text Index Supported
> * Image text (png, jpg, bmp etc.) Full Text Index Supported
> * Fast Full-Text Index
> * Fast Full-Text Search, almost in 0.1 second
> * Keyword View
> * SSD Optimization
> * HTTP Search Service (Beta)
> * Realtime Sync Full-Text Index (Beta)
> * Hight DPI Supported
> * Startup at Boot
> * Scanned PDF text search
### Changelog
#### 2023-3-4 [Version 1.3.1071](https://anytxt.net/download)
1. Added the feature of online search at raw text preview window;
2. Fixed the issue that [indexing never completes](https://anytxt.net/forums/topic/indexing-never-completes/);
3. Fixed some other known issues;
#### 2023-2-1 Version 1.3.1043
1. Added the feature of starting Anytxt at boot;
2. Added the feature of scanned PDF text indexing and search;
3. Added the feature of changing Anytxt font;
4. Fixed the issue that USB device occupation;
5. Fixed the issue that some [azw3 file encodes detect incorrectly](https://anytxt.net/forums/topic/some-of-the-azw3-files-are-not-rendered-properly/);
6. Fixed some other known issues;
#### 2022-11-26 Version 1.3.1019
1. Added support for binary file (exe, so, dll) full-text indexing and search;
2. Added the shortcut key Atl+G to the preview window to search for global content;
3. Added the shortcut key Atl+S to the preview window to search the content of this file;
4. Add the snippet to the search result item in the preview window;
5. Fixed the issue of characters in Japanese, Korean, Chinese, and other local encodings of chm files;
6. Fixed the issue that the wrong file name was displayed in the preview window after the result list item was clicked;
7. Fixed some other known issues;
#### 2022-10-30 Version 1.2.993
1. Added support for Edraw Max full-text indexing and search;
2. Added support for WizNote full-text indexing and search;
3. Added support for text in image (OCR) full-text indexing and search(Beta);
4. Added the feature of exporting the search result list;
5. Added the feature of show search terms snippets;
6. Added the feature of the multi-preview window;
7. Fixed the issue of google translation not working in China;
8. Fixed the issue of crash on some computers at ver1.2.941;
9. Fixed some other known issues;
#### 2022-9-3 Version 1.2.941
1. Added the feature of the line number;
2. Added the feature of the line match-tags in the text preview window scrollbar;
3. Added the feature of regex search in the preview window;
4. Fixed the issue that the indexing service works abnormally;
6. Try to fix the issue of freezing on some computers;
7. Fixed some other known issues;
#### 2022-7-30 Version 1.2.901
1. Added support for full-text indexing and searching in mind map formats: lighten, mmap, mm, xmind, etc.;
2. Added support for djvu and azw(3) full-text indexing and search;
3. Added support for ofd full-text indexing and search;
4. Add 64-bit program support;
5. Speed up indexing and searching;
6. Add right-click search in the text preview window;
7. Fixed the unclear fonts issue;
8. Added 한국어 language, thanks to VenusGirl – 비너스걸❤;
9. Fixed some known issues;
#### 2022-4-17 Version 1.2.715 (Beta)
1. Added the feature of syncing the index of specified folders;
#### 2022-4-10 Version 1.2.703 (Beta)
1. Added the feature of advanced search syntax (beta), you can use &|!"() to do some advanced search;
2. Added the feature of theme, Anytxt comes with 3 themes: default, light, dark;
3. Added the feature of HTTP search service (Beta), the fixed http server listen port is 9921, you can change the port in coming version;
4. Added the feature of editing multiple file types' inclusion and exclusion rules for indexing;
5. Fixed the issue that Anytxt may crash on some Windows 11;
6. Added Polski language, thanks to Dmocha;
7. Added עברית language, thanks to Yeshurun Kubi;
#### 2021-7-16 Version 1.2.540
1. Added the feature of custom hotkeys;
#### 2021-6-15 Version 1.2.532
1. Added Nederlands language, thanks to Atze;
2. Added Українська language, thanks to Helly;
3. Added the feature of rebuilding the index;
#### 2021-5-31 [Version 1.2.523]
1. Added online translation feature, supporting Google Translate, Bing Translator, and Yandex Translate. This feature requires the Internet;
2. Added toolbar;
3. Added forward and back feature for file text preview;
4. Added Microsoft OneNote file to default index file types;
5. Added Русский language, thanks to Антон Мырзин aka Paperdaemon;
6. Fix some issues;
#### 2021-4-23 [Version 1.2.483]
1. You can turn on/off the feature of displaying Anytxt in the system tray;
2. Added the feature of displaying Anytxt to the system context menu. You can start Anytxt directly in the system context menu;
3. Added the feature of filtering search results by directory;
4. Added the feature of filtering search results by multiple file types;
5. Fix some issues;
#### 2021-4-2 [Version 1.2.445]
1. Added the feature of that closing Anytxt to the system tray;
2. Added the feature of that word segmentation by space for Chinese, Japanese, Korean, and Vietnamese;
3. Added the feature of that results are default sorted by match degree and the relevance of documents to a given search query;
4. Optimized search speed, almost in 0.5 sec;
5. Fixed the issue that no files can be scanned on the FAT file system;
6. Fixed the issue that the full-text index engine could not work on some network devices;
7. Fixed some other known issues;
#### 2021-1-15 [Version 1.2.394]
1. Added the zoom-in/out feature;
2. Added the word wrap feature;
3. Added support for full-text indexing and searching in WPS Office formats .wps .et and .dps;
4. Improved performance when updating index data;
5. Fixed some other known issues;
6. Added multi-language support based on [google translation](https://translate.google.com/) for [www.anytxt.net](https://anytxt.net). It may not works fine in Mainland China;
#### 2020-12-4
1. Added the feature of right-click opening the contain file folder(s);
2. Added the feature of right-click copying the full path of the file(s);
#### 2020-12-1
1. Try to fix the index database corruption issue;
2. Added support for German, provided by dhu. Thank you very much;
3. Fixed some other known issues;
#### 2020-11-12
1. Added the feature of setting index database store path;
2. Fixed the issue that AnyTXT Searcher would block when starting;
3. Fixed some other known issues;
#### 2020-10-2
1. Added the feature of keyword browsing;
#### 2020-8-31
1. Added support for NAS devices. NAS storage based on Microsoft SMB protocol and CIFS protocol has been tested, and it works perfect. Other types of remote storage have not been tested;
#### 2020-6-13
1. Added support for full-text indexing and searching in e-book format epub;
2. Added support for full-text indexing and searching in e-book format mobi;
3. Added support for full-text indexing and searching in format chm;
4. Added support for full-text indexing and searching in e-book format fb2;
5. Added real-time displaying of the index status;
6. Added support for High DPI;
#### 2020-4-12
1. Added support for updating the full-text index database manually;
2. Added support for setting automatic update full-text index cycle;
3. Added support for starting and stopping full-text indexing service;
#### 2020-2-27
1. Added the command line;
2. Fixed known issues;
#### 2019-11-29
1. Try to fix 100% CPU usage issue;
2. Fix the issue of re-indexing during file update;
#### 2019-11-9
1. Added fuzzy matching search;
2. Added whole matching search(Beta);
3. Added Multi-language support. Currently, the Chinese language has been added due to there are many Chinese users;
You are welcome to translate it(English.ini) into your local language, I will integrate it into the installation package;
4. Fix some issues;
#### 2019-10-4
1. Added removal of the index;
2. Added the index rule feature;
3. Added the Ctrl+C feature;
4. Added the Ctrl+X feature;
5. Added the Delete feature;
6. Added the automatic detection of the new version feature;
7. Fix some issues;
#### 2019-6-24
1. Added snippets to the search results;
#### 2019-6-11
1. Added an icon to the search button;
#### 2019-6-8
1. Added support for the none-NTFS file system;
2. Speed up file traversal;
3. Reduced computer resource consumption;
4. Fixed some issues;
#### 2019-6-2
1. Added a community link to the help menu to get users' request;
2. Added support dragging for the search results list;
#### 2019-5-23:
1. Optimized indexing speed;
2. Optimized support for Arabic language based on user feedback;
3. Optimized support for Chinese language based on user feedback;
4. Optimized support for Korean language based on user feedback;
5. Optimized support for Japanese language based on user feedback;
6. Optimized the loading interface when the program starts;
# AnyTXT 全文搜索工具
------
AnyTXT 全文搜索工具是一款强大的本地数据全文搜索引擎,宛如本地磁盘版的谷歌搜索,是免费的谷歌桌面搜索替代方案。
AnyTXT 内置了强大的文档解析引擎,无需安装其他软件即可提取常见文档与图像的文本(Optical Character Recognition,光学字符识别,OCR)内容,并结合内置高速索引系统存储文本元数据。借助该工具,你可快速检索电脑内存在的任意文本。该工具支持 Windows 11、10、8、7、Vista、XP(1.2.540版本以下)、2003、2008、2012、2016、2022 等系统。
### [下载安装程序](https://anytxt.net/download/)
### [更多信息...](https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=57&ved=2ahUKEwiqx4jT-JvmAhWDJjQIHUJhB6Y4MhAWMAZ6BAgIEAE&url=https%3A%2F%2Fanytxt.net%2F&usg=AOvVaw22wtPNrBgzzwvh2hRvZm9I)
### 支持格式
> * 纯文本格式(txt、cpp、html等)
> * Microsoft Word(doc、docx)
> * Microsoft Excel(xls、xlsx)
> * Microsoft PowerPoint(ppt、pptx)
> * Microsoft OneNote(one)
> * 可移植文档格式(Portable Document Format,PDF)
> * 电子书格式(epub、mobi、djvu、chm、fb2、azw(3)等)
> * WPS文字格式(wps)
> * WPS表格格式(et)
> * WPS演示格式(dps)
> * 开放文档格式(Open Document Format),支持OpenOffice、LibreOffice等衍生格式
> * 思维导图格式(lighten、mmap、mm、xmind等)
> * 开放固定版式文档格式(Open Fixed-layout Document Format,OFD)
> * Edraw Max格式(eddx)
> * 为知笔记格式(ziw)
> * 图像格式(jpg、png、bmp、gif等)
> * 二进制文件(exe、dll、so)
> * 更多文档类型欢迎反馈
### 更多特性
> * 支持Microsoft Office(doc、xls、ppt)全文索引
> * 支持Microsoft Office 2007(docx、xlsx、pptx、docm、xlsm)全文索引
> * 支持多语言(含中文、日文、韩文)文档全文索引
> * 支持WPS Office(wps、et、dps)全文索引
> * 支持图像文本(png、jpg、bmp等)全文索引
> * 高速全文索引构建
> * 极速全文搜索,响应时间仅约0.1秒
> * 关键词浏览
> * SSD优化
> * HTTP搜索服务(测试版)
> * 实时同步全文索引(测试版)
> * 支持高DPI显示
> * 开机自启
> * 支持扫描版PDF文本检索
### 更新日志
#### 2023-3-4 [版本1.3.1071](https://anytxt.net/download)
1. 新增文本预览窗口在线搜索功能
2. 修复了[索引无法完成](https://anytxt.net/forums/topic/indexing-never-completes/)的问题
3. 修复了其他已知问题
#### 2023-2-1 版本1.3.1043
1. 新增开机启动AnyTXT功能
2. 新增扫描版PDF文本索引与检索功能
3. 新增修改AnyTXT字体功能
4. 修复了USB设备占用问题
5. 修复了部分[azw3文件编码识别错误](https://anytxt.net/forums/topic/some-of-the-azw3-files-are-not-rendered-properly/)的问题
6. 修复了其他已知问题
#### 2022-11-26 版本1.3.1019
1. 新增二进制文件(exe、so、dll)全文索引与检索支持
2. 为预览窗口新增快捷键Atl+G,用于全局内容搜索
3. 为预览窗口新增快捷键Atl+S,用于当前文件内容搜索
4. 在预览窗口的搜索结果项中添加代码片段
5. 修复了chm文件的日文、韩文、中文及其他本地编码字符显示问题
6. 修复了点击结果列表项后预览窗口显示错误文件名的问题
7. 修复了其他已知问题
#### 2022-10-30 版本1.2.993
1. 新增Edraw Max格式全文索引与检索支持
2. 新增为知笔记格式全文索引与检索支持
3. 新增图像文本(OCR)全文索引与检索功能(测试版)
4. 新增搜索结果列表导出功能
5. 新增搜索关键词片段展示功能
6. 新增多预览窗口功能
7. 修复了中国大陆地区谷歌翻译无法正常使用的问题
8. 修复了1.2.941版本部分电脑出现程序崩溃的问题
9. 修复了其他已知问题
#### 2022-9-3 版本1.2.941
1. 新增行号展示功能
2. 新增文本预览窗口滚动条匹配标签功能
3. 新增预览窗口正则搜索功能
4. 修复了索引服务异常工作的问题
6. 尝试修复部分电脑出现程序卡顿的问题
7. 修复了其他已知问题
#### 2022-7-30 版本1.2.901
1. 新增思维导图格式(lighten、mmap、mm、xmind等)全文索引与检索支持
2. 新增djvu与azw(3)格式全文索引与检索支持
3. 新增OFD格式全文索引与检索支持
4. 新增64位程序支持
5. 提升索引与搜索速度
6. 新增文本预览窗口右键搜索功能
7. 修复了字体显示模糊的问题
8. 新增韩语语言支持,感谢VenusGirl – 비너스걸❤
9. 修复了其他已知问题
#### 2022-4-17 版本1.2.715(测试版)
1. 新增指定文件夹索引同步功能
#### 2022-4-10 版本1.2.703(测试版)
1. 新增高级搜索语法功能(测试版),支持使用&|!"()进行高级搜索
2. 新增主题功能,AnyTXT自带3种主题:默认、浅色、深色
3. 新增HTTP搜索服务(测试版),默认监听端口为9921,后续版本将支持自定义端口
4. 新增索引包含/排除多文件类型规则编辑功能
5. 修复了部分Windows 11系统下程序可能崩溃的问题
6. 新增波兰语语言支持,感谢Dmocha
7. 新增希伯来语语言支持,感谢Yeshurun Kubi
#### 2021-7-16 版本1.2.540
1. 新增自定义快捷键功能
#### 2021-6-15 版本1.2.532
1. 新增荷兰语语言支持,感谢Atze
2. 新增乌克兰语语言支持,感谢Helly
3. 新增索引重建功能
#### 2021-5-31 [版本1.2.523]
1. 新增在线翻译功能,支持谷歌翻译、必应翻译与Yandex翻译,需联网使用
2. 新增工具栏
3. 新增文件文本预览前进与后退功能
4. 将Microsoft OneNote文件添加至默认索引文件类型列表
5. 新增俄语语言支持,感谢Антон Мырзин aka Paperdaemon
6. 修复了部分问题
#### 2021-4-23 [版本1.2.483]
1. 新增系统托盘显示AnyTXT的开关功能
2. 新增系统上下文菜单集成AnyTXT功能,可直接通过系统右键菜单启动AnyTXT
3. 新增按目录过滤搜索结果功能
4. 新增按多文件类型过滤搜索结果功能
5. 修复了部分问题
#### 2021-4-2 [版本1.2.445]
1. 新增将AnyTXT最小化至系统托盘的功能
2. 新增中文、日文、韩文与越南文的空格分词功能
3. 新增搜索结果默认按匹配度与文档相关性排序功能
4. 优化搜索速度,响应时间仅约0.5秒
5. 修复了FAT文件系统下无法扫描文件的问题
6. 修复了部分网络设备下全文索引引擎无法工作的问题
7. 修复了其他已知问题
#### 2021-1-15 [版本1.2.394]
1. 新增缩放功能
2. 新增自动换行功能
3. 新增WPS Office格式.wps、.et与.dps的全文索引与检索支持
4. 优化索引数据更新时的性能
5. 修复了其他已知问题
6. 为[www.anytxt.net](https://anytxt.net)新增基于[谷歌翻译](https://translate.google.com/)的多语言支持,中国大陆地区可能无法正常使用
#### 2020-12-4
1. 新增右键打开文件所在文件夹功能
2. 新增右键复制文件完整路径功能
#### 2020-12-1
1. 尝试修复索引数据库损坏问题
2. 新增德语语言支持,由dhu提供,特此致谢
3. 修复了其他已知问题
#### 2020-11-12
1. 新增索引数据库存储路径设置功能
2. 修复了AnyTXT启动时出现卡顿的问题
3. 修复了其他已知问题
#### 2020-10-2
1. 新增关键词浏览功能
#### 2020-8-31
1. 新增NAS设备支持,已测试基于Microsoft SMB协议与CIFS协议的NAS存储,运行效果良好,其他类型远程存储暂未测试
#### 2020-6-13
1. 新增epub格式电子书全文索引与检索支持
2. 新增mobi格式电子书全文索引与检索支持
3. 新增chm格式文件全文索引与检索支持
4. 新增fb2格式电子书全文索引与检索支持
5. 新增索引状态实时展示功能
6. 新增高DPI显示支持
#### 2020-4-12
1. 新增手动更新全文索引数据库功能
2. 新增自动更新全文索引周期设置功能
3. 新增全文索引服务启停功能
#### 2020-2-27
1. 新增命令行支持
2. 修复了已知问题
#### 2019-11-29
1. 尝试修复CPU占用率100%的问题
2. 修复文件更新时重复索引的问题
#### 2019-11-9
1. 新增模糊匹配搜索功能
2. 新增全匹配搜索功能(测试版)
3. 新增多语言支持,因大量中文用户使用,现已内置中文语言支持。欢迎将翻译文件(English.ini)转换为您的本地语言,我将集成至安装包中
4. 修复了部分问题
#### 2019-10-4
1. 新增索引移除功能
2. 新增索引规则功能
3. 新增Ctrl+C复制功能
4. 新增Ctrl+X剪切功能
5. 新增删除功能
6. 新增新版本自动检测功能
7. 修复了部分问题
#### 2019-6-24
1. 为搜索结果新增代码片段展示
#### 2019-6-11
1. 为搜索按钮新增图标
#### 2019-6-8
1. 新增非NTFS文件系统支持
2. 提升文件遍历速度
3. 降低计算机资源消耗
4. 修复了部分问题
#### 2019-6-2
1. 为帮助菜单新增社区链接以收集用户需求
2. 新增搜索结果列表拖拽功能
#### 2019-5-23:
1. 优化索引速度
2. 根据用户反馈优化阿拉伯语语言支持
3. 根据用户反馈优化中文语言支持
4. 根据用户反馈优化韩文语言支持
5. 根据用户反馈优化日文语言支持
6. 优化程序启动加载界面
提供机构:
anytxt
原始信息汇总
AnyTXT Searcher 数据集概述
支持的格式
- 纯文本格式(txt, cpp, html 等)
- Microsoft Word(doc, docx)
- Microsoft Excel(xls, xlsx)
- Microsoft PowerPoint(ppt, pptx)
- Microsoft OneNote(one)
- 便携式文档格式(pdf)
- 电子书格式(epub, mobi, djvu, chm, fb2, azw(3) 等)
- WPS Word 格式(wps)
- WPS Excel 格式(et)
- WPS PowerPoint 格式(dps)
- 开放文档格式(OpenOffice, LibreOffice 等)
- 思维导图格式(lighten, mmap, mm, xmind 等)
- 开放固定布局文档格式(ofd)
- Edraw Max 格式(eddx)
- WizNote 格式(ziw)
- 图像格式(jpg, png, bmp, gif 等)
- 二进制文件(exe, dll, so)
更多功能
- 支持 Microsoft Office(doc, xls, ppt)全文索引
- 支持 Microsoft Office 2007(docx, xlsx, pptx, docm, xlsm, docm)全文索引
- 支持多语言(包括中文、日文、韩文)文档全文索引
- 支持 WPS Office(wps, et, dps)全文索引
- 支持图像文本(png, jpg, bmp 等)全文索引
- 快速全文索引
- 快速全文搜索,几乎在 0.1 秒内完成
- 关键词视图
- SSD 优化
- HTTP 搜索服务(Beta)
- 实时同步全文索引(Beta)
- 高 DPI 支持
- 开机启动
- 扫描 PDF 文本搜索
更新日志
2023-3-4 版本 1.3.1071
- 增加了在线搜索功能;
- 修复了索引永不完成的问题;
- 修复了一些其他已知问题。
2023-2-1 版本 1.3.1043
- 增加了开机启动 Anytxt 的功能;
- 增加了扫描 PDF 文本索引和搜索的功能;
- 增加了更改 Anytxt 字体的功能;
- 修复了 USB 设备占用问题;
- 修复了一些 azw3 文件编码检测不正确的问题;
- 修复了一些其他已知问题。
2022-11-26 版本 1.3.1019
- 增加了对二进制文件(exe, so, dll)的全文索引和搜索支持;
- 增加了预览窗口的快捷键 Alt+G 进行全局内容搜索;
- 增加了预览窗口的快捷键 Alt+S 进行文件内容搜索;
- 在预览窗口的搜索结果项中增加了片段;
- 修复了 chm 文件中日文、韩文、中文等本地编码字符的问题;
- 修复了点击结果列表项后预览窗口显示错误文件名的问题;
- 修复了一些其他已知问题。
2022-10-30 版本 1.2.993
- 增加了对 Edraw Max 的全文索引和搜索支持;
- 增加了对 WizNote 的全文索引和搜索支持;
- 增加了对图像文本(OCR)的全文索引和搜索支持(Beta);
- 增加了导出搜索结果列表的功能;
- 增加了显示搜索词片段的功能;
- 增加了多预览窗口的功能;
- 修复了在中国地区谷歌翻译无法使用的问题;
- 修复了在某些电脑上版本 1.2.941 崩溃的问题;
- 修复了一些其他已知问题。
2022-9-3 版本 1.2.941
- 增加了行号功能;
- 增加了文本预览窗口滚动条中的行匹配标签功能;
- 增加了预览窗口中的正则表达式搜索功能;
- 修复了索引服务异常工作的问题;
- 尝试修复某些电脑上的冻结问题;
- 修复了一些其他已知问题。
2022-7-30 版本 1.2.901
- 增加了对思维导图格式(lighten, mmap, mm, xmind 等)的全文索引和搜索支持;
- 增加了对 djvu 和 azw(3) 的全文索引和搜索支持;
- 增加了对 ofd 的全文索引和搜索支持;
- 增加了 64 位程序支持;
- 加快了索引和搜索速度;
- 增加了文本预览窗口中的右键搜索功能;
- 修复了字体不清晰的问题;
- 增加了韩文语言支持;
- 修复了一些已知问题。
2022-4-17 版本 1.2.715(Beta)
- 增加了同步指定文件夹索引的功能。
2022-4-10 版本 1.2.703(Beta)
- 增加了高级搜索语法功能(Beta);
- 增加了主题功能,Anytxt 提供了三种主题:默认、浅色、深色;
- 增加了 HTTP 搜索服务功能(Beta);
- 增加了编辑多种文件类型的包含和排除规则功能;
- 修复了 Anytxt 在某些 Windows 11 上可能崩溃的问题;
- 增加了波兰语语言支持;
- 增加了希伯来语语言支持。
2021-7-16 版本 1.2.540
- 增加了自定义热键功能。
2021-6-15 版本 1.2.532
- 增加了荷兰语语言支持;
- 增加了乌克兰语语言支持;
- 增加了重建索引功能。
2021-5-31 版本 1.2.523
- 增加了在线翻译功能,支持谷歌翻译、必应翻译和 Yandex 翻译;
- 增加了工具栏;
- 增加了文件文本预览的前进和后退功能;
- 增加了 Microsoft OneNote 文件到默认索引文件类型;
- 增加了俄语语言支持;
- 修复了一些问题。
2021-4-23 版本 1.2.483
- 增加了在系统托盘中显示 Anytxt 的功能;
- 增加了在系统上下文菜单中显示 Anytxt 的功能;
- 增加了按目录过滤搜索结果的功能;
- 增加了按多种文件类型过滤搜索结果的功能;
- 修复了一些问题。
2021-4-2 版本 1.2.445
- 增加了关闭 Anytxt 到系统托盘的功能;
- 增加了按空格分词功能;
- 增加了按匹配程度和相关性排序搜索结果的功能;
- 优化了搜索速度;
- 修复了在 FAT 文件系统上无法扫描文件的问题;
- 修复了全文索引引擎在某些网络设备上无法工作的问题;
- 修复了一些其他已知问题。
2021-1-15 版本 1.2.394
- 增加了缩放功能;
- 增加了自动换行功能;
- 增加了对 WPS Office 格式(.wps, .et, .dps)的全文索引和搜索支持;
- 改进了更新索引数据时的性能;
- 修复了一些其他已知问题;
- 增加了多语言支持。
2020-12-4
- 增加了右键打开包含文件夹的功能;
- 增加了右键复制文件全路径的功能。
2020-12-1
- 尝试修复索引数据库损坏问题;
- 增加了德语支持;
- 修复了一些其他已知问题。
2020-11-12
- 增加了设置索引数据库存储路径的功能;
- 修复了 AnyTXT Searcher 启动时会阻塞的问题;
- 修复了一些其他已知问题。
2020-10-2
- 增加了关键词浏览功能。
2020-8-31
- 增加了对 NAS 设备的支持。
2020-6-13
- 增加了对电子书格式 epub 的全文索引和搜索支持;
- 增加了对电子书格式 mobi 的全文索引和搜索支持;
- 增加了对格式 chm 的全文索引和搜索支持;
- 增加了对电子书格式 fb2 的全文索引和搜索支持;
- 增加了实时显示索引状态的功能;
- 增加了高 DPI 支持。
2020-4-12
- 增加了手动更新全文索引数据库的功能;
- 增加了设置自动更新全文索引周期的功能;
- 增加了启动和停止全文索引服务的功能。
2020-2-27
- 增加了命令行功能;
- 修复了已知问题。
2019-11-29
- 尝试修复 100% CPU 使用率问题;
- 修复了文件更新时的重新索引问题。
2019-11-9
- 增加了模糊匹配搜索功能;
- 增加了完全匹配搜索功能(Beta);
- 增加了多语言支持;
- 修复了一些问题。
2019-10-4
- 增加了删除索引功能;
- 增加了索引规则功能;
- 增加了 Ctrl+C 功能;
- 增加了 Ctrl+X 功能;
- 增加了删除功能;
- 增加了自动检测新版本功能;
- 修复了一些问题。
2019-6-24
- 增加了搜索结果的片段功能。
2019-6-11
- 增加了搜索按钮的图标。
2019-6-8
- 增加了对非 NTFS 文件系统的支持;
- 加快了文件遍历速度;
- 减少了计算机资源消耗;
- 修复了一些问题。
2019-6-2
- 增加了社区链接功能;
- 增加了搜索结果列表的拖拽支持。
2019-5-23
- 优化了索引速度;
- 优化了阿拉伯语支持;
- 优化了中文支持;
- 优化了韩文支持;
- 优化了日文支持;
- 优化了程序启动时的加载界面。
搜集汇总
数据集介绍

构建方式
在信息检索领域,构建高效的数据集对于提升搜索性能至关重要。AnyTXT Searcher数据集的构建依托于其内置的文档解析引擎,该引擎能够自动提取多种格式文档的文本内容,包括常见的办公文档、电子书、图像文件等。通过高速索引系统,引擎将提取的文本元数据存储于本地数据库中,形成结构化的全文索引。构建过程涉及对指定文件夹的实时或定期扫描,确保索引与本地文件系统的同步更新,从而构建出一个覆盖广泛文档类型且动态维护的本地全文检索数据集。
特点
该数据集的核心特点在于其广泛的格式兼容性与高效的多语言支持。它能够处理超过二十种文档格式,从纯文本到复杂的二进制文件,均能实现全文索引。特别值得一提的是,数据集集成了光学字符识别技术,使得图像中的文字也能被检索。在语言处理上,数据集优化了对中文、日文、韩文等非空格分隔语言的分词支持,并实现了快速的模糊匹配与精确搜索。其索引系统经过深度优化,即使在处理海量本地文件时,也能保证亚秒级的搜索响应速度,展现出卓越的性能与实用性。
使用方法
在应用层面,该数据集主要通过AnyTXT Searcher软件平台进行交互式使用。用户安装软件后,可指定本地或网络存储路径进行索引构建。完成初始化索引后,用户即可通过图形界面或命令行输入关键词进行全文检索,系统会即时返回包含关键词的文档列表及上下文片段。数据集支持高级搜索语法,允许用户通过逻辑运算符组合查询条件。此外,软件提供的预览、翻译、结果导出等功能,进一步拓展了数据集的实用价值,使其成为个人与企业进行本地知识管理和信息挖掘的强大工具。
背景与挑战
背景概述
在信息检索与本地数据管理领域,高效的全文本搜索技术一直是提升个人与企业数据处理效率的关键。AnyTXT Searcher数据集由同名软件开发团队于2019年创建,旨在构建一个支持多格式文档解析与高速索引的本地全文搜索引擎。该数据集的核心研究问题聚焦于如何实现对包括文本、图像、办公文档及电子书在内的异构数据源进行实时、精准的文本提取与检索,从而弥补传统桌面搜索工具在格式兼容性与多语言支持上的不足。其持续更新与功能扩展,显著推动了本地化信息检索系统的实用化进程,为跨语言、跨平台的数据管理提供了重要技术参考。
当前挑战
AnyTXT Searcher数据集所应对的领域挑战在于解决异构文档格式下的全文检索难题,尤其是对扫描PDF、图像OCR及二进制文件等非结构化数据的文本提取与索引。构建过程中的挑战包括多语言文本的分词与编码处理,例如中日韩等语言的特殊字符解析;同时,需克服不同文件系统(如FAT、NTFS)及网络存储设备的兼容性问题,确保索引服务在各类环境中的稳定运行。此外,实时同步索引与高并发搜索的性能优化,亦是数据集构建中需持续攻克的技术瓶颈。
常用场景
经典使用场景
在信息检索与文档管理领域,AnyTXT Searcher数据集作为本地全文搜索引擎的核心资源,其经典使用场景体现在对多格式文档的快速索引与检索。该数据集通过内置的文档解析引擎,支持从文本文件、Office文档、PDF、电子书乃至图像OCR中提取文本内容,构建高效的元数据索引系统。用户能够在海量本地文件中实现亚秒级的关键词搜索,极大地提升了文档查找的效率与精准度,尤其适用于学术研究、法律文档审查等需要处理复杂异构数据的专业场景。
实际应用
在实际应用层面,AnyTXT Searcher数据集广泛应用于企业文档管理、个人知识库构建以及专业数据审计等场景。例如,法律从业者可借助其快速定位案例文件中的关键条款,研究人员能高效检索实验报告与学术文献,IT运维人员则可用于日志文件分析。数据集支持Windows多版本系统及网络存储设备,结合HTTP搜索服务与实时同步索引功能,实现了从桌面到小型工作组的无缝集成,显著优化了工作流程,体现了实用性与可扩展性的高度统一。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在检索算法优化与多模态数据处理领域。例如,基于其索引架构开发的模糊匹配与正则表达式搜索功能,为后续检索系统的查询扩展研究提供了参考;集成OCR的图像文本检索模块,则推动了视觉-语言交叉检索技术的发展。此外,数据集支持的高级搜索语法、多语言分词机制以及实时同步索引方案,也激发了诸多关于分布式检索、跨语言信息检索的学术探索,成为本地化搜索引擎技术演进的重要基石。
以上内容由遇见数据集搜集并总结生成



