創(chuàng)作收集素材不易,點個【關(guān)注】支持一下吧!
NAS文檔搜索需求
日常工作涉及泛行業(yè)的解決方案
必不可少要搜集一些各行各業(yè)的相關(guān)文檔
一方面,這些文檔都是碎片化的
并且很多都不是文本格式
基于純文本的搜索,需要轉(zhuǎn)換格式
另一方面,這些資料來之不易
考慮到數(shù)據(jù)安全問題
通過NAS來存儲這些文檔就顯得很有必要
NAS的磁盤陣列可以很好的保護數(shù)據(jù)
當(dāng)然順帶解決了
各類云盤跑路、資源和諧等問題
這時候在NAS系統(tǒng)上對文檔內(nèi)容進行搜索就成了問題
我需要多端統(tǒng)一的搜索體驗
威聯(lián)通-qsirch
最終發(fā)現(xiàn)了威聯(lián)通-qsirch這個神器
我愿稱之為目前全平臺地表最強!包括mac、win、其它品牌NAS在內(nèi)。
當(dāng)然有更好方案的可以評論區(qū)交流
設(shè)置
首先需要在“設(shè)置”-“高級索引”里面把OCR選上
這樣就會用到AI套件的服務(wù)能力了
等索引完畢就可以正常使用了
標(biāo)準(zhǔn)內(nèi)容識別
打開qsirch,挑一張標(biāo)準(zhǔn)文檔,但格式為圖片的內(nèi)容進行搜索
很輕松就找到了
圖片內(nèi)容搜索
qsirch 2-1 OCR效果.png
搜索一個存在于圖片上的詞
右側(cè)提示有命中結(jié)果,包括文件名,相關(guān)段落上下文
點擊可以快速查看文件
還可以突出顯示OCR識別的結(jié)果
搜索體驗可以說是非常好了
低精度圖片內(nèi)容搜索
特意找了一個“包漿圖”來難為qsirch
可以看到這張圖的精度已經(jīng)糊到人眼識別都有困難的程度了
沒想到qsirch還是能識別個大概
縱向文字搜索
組織架構(gòu)或者清單類信息通常會以縱向文字的方式呈現(xiàn)
一般來說OCR是無法識別這種縱向排列的文字的
qsirch當(dāng)然也不例外
查看對應(yīng)內(nèi)容的識別結(jié)果
發(fā)現(xiàn)qsirch不光是不能識別縱向
連單字都沒有識別
我猜,它應(yīng)該是為了保證正確率,采用了詞組識別策略
在縱向文字的場景下
一行只有一個字,不構(gòu)成詞組
所以直接就沒有識別
PPT內(nèi)容搜索
PPT的內(nèi)容一般為圖文混合
找了PPT中的一個存在于圖片中的內(nèi)容進行搜索
居然也很準(zhǔn)確的找到了
就是上下文有點一言難盡
應(yīng)該不是qsirch的問題
這個PPT是網(wǎng)上下載的,包含了標(biāo)簽信息
上下文里面明顯就是那些標(biāo)簽信息
不過無所謂,能搜到我要的內(nèi)容就行
套件聯(lián)動
在FileStation的搜索中可以選擇開啟qsirch,好評!
對于閉源系統(tǒng)的自研套件來說,打通多個套件的使用并不是什么難事
友商門可以好好學(xué)習(xí)一下,如何從用戶的角度設(shè)計產(chǎn)品
關(guān)于我的威聯(lián)通
是的!你沒有看錯!
我的威聯(lián)通是一臺電視盒子改裝的。
它的配置是:RK3566處理器,四核64位Cortex-A55,8G內(nèi)存
稍好于原廠QNAP的TS-416
QNAP的TS-416型號NAS搭載了瑞芯微RK3568處理器,這是一款中高端SoC,四核64位Cortex-A55,主頻最高2.0GHz,并且支持Docker,標(biāo)配的4G內(nèi)存。
以上就是本文的全部內(nèi)容,感謝觀看!
創(chuàng)作收集素材不易,點個【關(guān)注】支持一下吧!
,