Storm里面fieldsGrouping和Field的概念详解

来源：互联网发布：只有程序员才懂的笑话编辑：程序博客网时间：2024/06/10 12:27

这个Field通常和fieldsGrouping分组机制一起使用，这个Field特别难理解，我自己也是在网上看了好多文章，感觉依旧讲的不是很清楚，是似而非，没有抓到重点。这个问题足足困扰了我3-4天时间，一直理解不了Field的概念，

当前我觉得new Fields("word")就相当于表的表头，就是定义这个域，这个域里面放的东西，是emit进去的

Spouts--->Bolts;

Bolts---->Bolts;

Field："Word"

the

sporm

...

模拟消息发送，根据Field里面的内容自动选择Task

当遇到相同内容的时候，会找到之前有此内容的Task

the--->Task1（随机）

sporm--->Task2（随机）

ant--->Task3（随机）

the--->Task1（同样Field内容映射到Task1）

see--->Task4（随机）

watch---->Task2(没找到同样内容的Task，随机找个Task2)

例子1：

第一步：定义了一个表头

public void declareOutputFields(OutputFieldsDeclarer declarer)

{

declarer.declare(new Fields("word"));

}

第二步：往这个Field空间里面emit进去内容（可以是Bolt和Spolt）

public void execute(Tuple input, BasicOutputCollector collector)

{

String sentence = input.getString(0);

String[] words = sentence.split(" ");

for (String word : words)

{

word = word.trim();

if (!word.isEmpty())

{

word = word.toLowerCase();

collector.emit(new Values(word));

}

第三步：关联步骤

TopologyBuilder builder = new TopologyBuilder();

builder.setSpout("word-reader",new WordReader());

builder.setBolt("word-normalizer", new WordNormalizer()).shuffleGrouping("word-reader");

Integer number = 2;

builder.setBolt("word-counter", new WordCounter(), 4).fieldsGrouping("word-normalizer", new Fields("word"));

第四步：

最终实现的结果：

Field：Word

the

sporm

...

例子2：

第一步：

public void declareOutputFields(OutputFieldsDeclarer declarer)

{

declarer.declare(new Fields("word", "count"));

}

第二步：

public void execute(Tuple tuple, BasicOutputCollector collector)

{

String word = tuple.getString(0);

Integer count = counts.get(word);

if (count == null)

count = 0;

count++;

counts.put(word, count);

collector.emit(new Values(word, count));

}

第三步：

Fields("word", "count")

“is”，1

“sporm”，3

“the”，2

.....

例子3：

D:\.....\Workspaces\MyEclipse 8.5\bigData\examples-ch06-real-life-app-master\src\main\java\storm\analytics\....

第一步：

TopologyBuilder builder = new TopologyBuilder();

builder.setSpout("read-feed", new UsersNavigationSpout(), 3);

builder.setBolt("get-categ", new GetCategoryBolt(), 3).shuffleGrouping("read-feed");

builder.setBolt("user-history", new UserHistoryBolt(), 5).fieldsGrouping("get-categ", new Fields("user"));

第二步：发送者输出是三个结构体：Fields("user","product", "categ")

GetCategoryBolt.java

public void execute(Tuple input, BasicOutputCollector collector)

{

NavigationEntry entry = (NavigationEntry)input.getValue(1);

if("PRODUCT".equals(entry.getPageType())){

try {

String product = (String)entry.getOtherData().get("product");

// Call the items API to get item information

Product itm = reader.readItem(product);

if(itm ==null)

return ;

String categ = itm.getCategory();

collector.emit(new Values(entry.getUserId(), product, categ));

} catch (Exception ex) {

System.err.println("Error processing PRODUCT tuple"+ ex);

ex.printStackTrace();

}

@Override

public void declareOutputFields(OutputFieldsDeclarer declarer) {

declarer.declare(new Fields("user","product", "categ"));

}

第三步：new Fields("user"))只取Fields("user","product", "categ"))中的User

builder.setBolt("user-history", new UserHistoryBolt(), 5).fieldsGrouping("get-categ", new Fields("user"));

1 0