Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

自己做分词，一般选择继承Tokenizer类。在以前的版本中只需要重写Next()方法就可以了。这个类比较简单，而塔的父类TokenStream则更加简单了，和接口没什么两样：

// 2.1版
public abstract class TokenStream
    {
         /// <summary> Returns the next token in the stream, or null at EOS. </summary>
         public abstract Token Next();

         /// <summary> Releases resources associated with this stream. </summary>
         public virtual void   Close()
        {
        }
    }

到了2.3.1版本中，这个抽象类发生了很多变化.下面是2.3.1版的TokenStream类代码。

Code
1 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

public abstract class TokenStream
2 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

{
3

/// <summary>Returns the next token in the stream, or null at EOS.
5 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// The returned Token is a "full private copy" (not
6 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// re-used across calls to next()) but will be slower
7 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// than calling {@link #Next(Token)} instead..
8 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// </summary>
9 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

public virtual Token Next()
10 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

{
11

Token result = Next(new Token());
12 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

if (result != null)
14 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

{
15

Payload p = result.GetPayload();
16 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

if (p != null)
17 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

{
18

result.SetPayload((Payload) p.Clone());
19 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

}
20

}
21

return result;
23 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

}
24

/// <summary>Returns the next token in the stream, or null at EOS.
26 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// When possible, the input Token should be used as the
27 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// returned Token (this gives fastest tokenization
28 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// performance), but this is not required and a new Token
29 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// may be returned. Callers may re-use a single Token
30 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// instance for successive calls to this method.
31 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// <p>
32 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// This implicitly defines a "contract" between
33 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// consumers (callers of this method) and
34 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// producers (implementations of this method
35 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// that are the source for tokens):
36 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// <ul>
37 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// <li>A consumer must fully consume the previously
38 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// returned Token before calling this method again.</li>
39 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// <li>A producer must call {@link Token#Clear()}
40 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// before setting the fields in it & returning it</li>
41 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// </ul>
42 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// Note that a {@link TokenFilter} is considered a consumer.
43 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// </summary>
44 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// <param name="result">a Token that may or may not be used to return
45 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// </param>
46 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// <returns> next token in the stream or null if end-of-stream was hit
47 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// </returns>
48 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

public virtual Token Next(Token result)
49 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

{
50

return Next();
51 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

}
52

/// <summary>Resets this stream to the beginning. This is an
54 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// optional operation, so subclasses may or may not
55 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// implement this method. Reset() is not needed for
56 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// the standard indexing process. However, if the Tokens
57 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// of a TokenStream are intended to be consumed more than
58 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// once, it is necessary to implement reset().
59 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

/// </summary>
60 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

public virtual void Reset()
61 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

{
62

}
63

/// <summary>Releases resources associated with this stream. </summary>
65 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

public virtual void Close()
66 Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

{
67

}
68

}

可以看到，2.3.1版本中多了一个Reset方法和一个Next方法的重载。

在它的子类中重写了Reset和Close方法，但是Next方法没有变化。

Code

如果，你建立一个类，继承自Tokenizer类，然后，这个时候你做其他事情去了，然后等你回来，你写了调用的代码，嘿嘿，问题来了。会报一个堆栈溢出错误。而你根本不知道这个错误是怎么产生的。这个父类写得太不厚道了，虽然Next方法是必然被重写掉的。

秒客网

Lucene.Net 2.3.1版变化之TokenStream（搞笑了）

相关文章