• Stars
    star
    225
  • Rank 177,187 (Top 4 %)
  • Language
    Java
  • License
    Apache License 2.0
  • Created about 11 years ago
  • Updated almost 8 years ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

元搜索引擎

元搜索引擎

通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。

自己没搜索引擎,又想要大规模的数据源,怎么办?可以对百度搜索和谷歌搜索善加利用,以小搏大,站在巨人的肩膀上。有很多的应用场景可以很巧妙地借助百度搜索和谷歌搜索来实现,比如网站的新闻采集,比如技术、品牌的新闻跟踪,比如知识库的收集,比如人机问答系统等,我之前做的一个准确率达百分之九十几的人机问答系统的数据源,其中一部分就是充分利用了百度搜索和谷歌搜索。我们可以很容易地扩展到其他的搜索引擎,使用JSoup+CSSPath技术,轻松获取页面的自定义的内容。

捐赠致谢

https://travis-ci.org/ysc/search

More Repositories

1

QuestionAnsweringSystem

QuestionAnsweringSystem是一个Java实现的人机问答系统,能够自动分析问题并给出候选答案。
Java
1,957
star
2

word

Java分布式中文分词组件 - word分词
Java
1,812
star
3

cws_evaluation

Java开源项目cws_evaluation:中文分词器分词效果评估对比
Lex
948
star
4

APDPlat

APDPlat是Application Product Development Platform的缩写,即应用级产品开发平台。
JavaScript
521
star
5

data-generator

如果你在从事大数据BI的工作,想对比一下MySQL、GreenPlum、Elasticsearch、Hive、Spark SQL、Presto、Impala、Drill、HAWQ、Druid、Pinot、Kylin、ClickHouse、Kudu等不同实现方案之间的表现,那你就需要一份标准的数据进行测试,这个开源项目就是为了生成这样的标准数据。
Java
278
star
6

superword

Superword is a Java open source project dedicated in the study of English words analysis and auxiliary reading.
Java
267
star
7

HtmlExtractor

HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件。
Java
157
star
8

jsearch

jsearch:高性能的全文检索工具包
Java
92
star
9

rank

rank是一个seo工具,用于分析网站的搜索引擎收录排名。
Java
66
star
10

realtime-log

微服务日志之实时日志
Java
30
star
11

short-text-search

自定制的精准短文本搜索服务
Java
18
star
12

word_web

通过web服务器对word分词的资源进行集中统一管理
Java
17
star
13

counter

分布式环境下的原子计数器和API每天调用次数限制
Java
17
star
14

high-availability

保障服务的持续高可用、高性能及负载均衡
Java
17
star
15

baby-typing-game

适合2到6岁的宝宝打字游戏
HTML
10
star
16

borm

大数据的对象持久化
Java
10
star
17

ysc.github.com

ysc.github.com
CSS
2
star
18

luke

Automatically exported from code.google.com/p/luke
Java
1
star
19

AudiobooksForKids

A collection of best-selling audiobooks for kids, from timeless classics to popular series.
1
star