最終更新日 2024-06-06
新しくなった米国商標調査システムの使い方解説の第三弾は、Regexサーチを取り上げます。Regexとは「Regular expressions」の略語です。読み方は「レゲックス」で、これはコンピュータプログラミングの世界では「正規表現」と呼ばれる、よく使われる用語です。第二弾で解説したフィールドタグサーチの検索式にレゲックスを組み込んで使います。スペリングや発音のバリエーションを、パターンによってマッチさせることができます。正規表現という言葉は理解しにくいですが、英語の「regular expressions」は「規則性のある表現」という意味なので、規則性のあるパターンでマッチさせると考えれば理解しやすいかもしれません。称呼が類似する商標の検索や、通常とは異なるスペリングを使った商標の検索に適しています。
この記事では、Regexサーチ(以下、「レゲックスサーチ」といいます。)の基本的事項をUSPTOの公式解説動画とハンドアウト資料などから学んだことをベースにして紹介します。これを使いこなそうと思うとコンピュータプラグラミングの知識が必要になると思われるかもしれません。しかし、米国商標調査を可能な範囲で自分でもやってみたい、USPTOが提供する無料の商標調査システムをある程度使えるようになれたらいい、くらいの気持ちで、気軽にレゲックスサーチに触れてみてはいかがでしょうか?この記事は正規表現について解説するものではなく、USPTOが提供する商標調査システムの使い方を、初心者の方向けに解説するものであることをご理解ください。
目次
1.レゲックスサーチの概要
商標の出願前クリアランスサーチをするときは、自分が出願しようとする商標が文字商標である場合、その文字列とスペルが同じ商標を見つけ出すだけでは不十分です。スペルが違っていても発音すれば全く同じか又は紛らわしく類似する商標を見落してしまうと、審査において拒絶理由の引例に挙げられてしまいます。
そこで、まずは自分の商標(調査対象商標)のどの部分に、どんな変更のバリエーションがあり得るかを考えます。そして想定されるバリエーションをパターン化します。そのパターンにマッチする商標を検索するのがレゲックスサーチです。
レゲックスサーチでは、調査の目的に合ったフィールドタグと一緒に使います。例えば、文字商標を検索する時によく使われる「CM」というフィールドタグがあります。普通のフィールドタグサーチであれば、「CM:trademark」という検索式を使います。コロンの後に調査したい文字列を小文字で入力します。この場合、「trademark」と同一の文字列を文字商標中に含むものや、Pseudo markフィールドや翻訳の説明フィールドに含む商標を検索します。(USPTOの商標調査システムで使われるフィールドタグやレゲックスの使い方や検索例はヘルプページの「Advanced」のタブ内で詳しく紹介されているので参照してください。)
一方、レゲックスサーチでは、例えば「CM:/.*trad.m[aeiouy]rk.*/」のような検索式を使います。コロンの後にレゲックスの構文が始まることを示す「/」を入力し、その後に「trademark」から想定されるバリエーションのパターンを、特殊な記号などを使って入力し、最後にレゲックスの構文が終わることを示す「/」を入力します。
レゲックスサーチは、
- 「CM」などのフィールドタグの検索ワードとしてコロンの後に入力する。
- 検索ワードは「/」と「/」の間に入力する。
- 検索ワードのバリエーションのパターンを特別な記号(以下で説明します。)などを使って表現する。
という点を押さえておいてください。
2.レゲックスの構文例
(1)レゲックスの作り方
レゲックスサーチの構文を理解するために具体例を見ていきましょう。「Change」という文字商標を出願しようとして、登録の障害となりそうな、称呼が類似する商標を探す場合を例にとります。本来なら指定商品・サービスの関連性も考慮すべきですが、検索式が複雑になってしまうので省略します。また、通常では絞り込みを行うために「AND LD:true」(存続中のものに絞り込む場合)なども併記されますが、それも省略します。次の例はレゲックスを用いた検索式の一例です。
【例1】 CM:/.*t?c[ch][aeiouy]{1,2}nd?[gj].*/
「CM:」は文字商標を検索する時によく使われるフィールドタグです。レゲックスは「/」(通常の半角スラッシュ)で囲まれた部分です。つまり「.*t?c[ch][aeiouy]{1,2}nd?[gj].*」の部分です。この検索式全体は、大まかに言えば、「レゲックスで指定した「change」のスペルのバリエーションとマッチするものを、文字商標、Pseudo mark、標章の翻訳のいずれかのフィールドの中に含んでいる商標を探す」という意味になります。
称呼類似・スペル近似の商標をマッチさせるレゲックスを組み立てるには、調査対象ワードを音節単位で語頭から順番に検討していき、どのようなバリエーションのパターンならマッチさせられるかを考えます。そして語頭から語尾にかけて、レゲックスのパーツを組み込んでいきます。レゲックスのパーツには、以下のものがあります。
- Regex wildcard(レゲックスで用いられるワイルドカード)
「.」 - Quantifiers(量指定子。出現する量(個数、回数)を指定するパーツ)
「*」、「?」、「+」、「{ }」 - Wildcard combined with quantifiers(出現する量(個数、回数)が指定されたワイルドカード)
「.*」、「.?」、「.+」、「.{ }」 - Symbols that act as logical operators(論理演算子として作用する記号)
「|」、「[^ ]」 - Grouping(一つのグループとして内側に列挙された文字列をどのように扱うかを指定するパーツ)
「( )」、「[ ]」、「[ – ]」、「< >」
これらの他にも、ハイフンや「+」の記号や「@」などの特殊な記号をマッチさせるための「\」(バックスラッシュ)や様々な目的に沿った入力例や調査例などがヘルプページに記載されているので、そちらも参考になります。
(2)レゲックスの構文例
「Change」という単語を音節単位でみると、子音の「Ch」(tʃ)、母音の「ei」、子音の「n」、子音の「dʒ」に分けることができます。英語の音節を特定するには深い知識が必要になりそうですが、だいたいの発音で作ってみればよいと思います。バリエーションを考えるべき音については、USPTOのヘルプページの「Advanced」のタブ内の「Regular expressions」の中の「Phonetic sounds」の中に例示されているものが参考になります。
「Ch-a-n-ge」の順番で、スペルのバリエーションを指定したり、その出現数を指定したり、そのままの文字でマッチさせたり、何にでも置き換わることのできるワイルドカードを置いたりするなど、マッチさせるパターンを組み立てていくイメージです。この検索式で使われているレゲックスの記号とその意味を次の表で説明します。
/.*t?c[ch][aeiouy]{1,2}nd?[gj].*/
記号 | 意 味 | 検索例など |
---|---|---|
/ | レゲックスの始まりと終わりにそれぞれ半角スラッシュを置く。 | 最初の「/」と最後の「/」に囲まれている部分がレゲックス(正規表現)が作用する部分であることを示す。半角スラッシュで囲むことによって、レゲックスの文法が適用される特殊な次元にあることを宣言している。 |
.* | この記号が置かれた位置に文字がなくてもいい、又はいくつあってもいい、という意味。 | /a.*/では、「a」「ab」「abc」「abcdefg」などがマッチする。 /.*change/では、「change」「exchange」「xchange」「x-change」「the power to change」などがマッチする。 調査対象ワードのみの調査ではその前後に別の文字列が追加されている重要な商標を見落としかねないため、調査セッションの始めの段階では、できるだけ広くマッチさせるために、レゲックスの最初と最後に「.*」がよく使われる。 |
? | この記号の直前の要素が0個又は1個出現するという意味。 | /abc?/では、直前の要素である「c」が0個又は1個出現する「ab」と「abc」がマッチする。※フィールドタグサーチでの「?」とは機能が違うことに注意。 |
[ ] | 角括弧(ブラケット)内のどれか一文字とマッチするという意味。 | /[abc]/では、「a」「 b」「c」のいずれか一文字とマッチする。 /[aeiouy]/では、「a」「e」「i」「o」「u」「y」のいずれか一文字とマッチ。(a,e,i,o,u,yは英語の母音にあたる。) |
{ } | 波括弧(ブレース)の直前にある要素が、波括弧内に指定された数だけ出現するという意味。 | 直前の要素が出現する数の指定方法は、数をそのまま数字で指定する方法 (2個であれば「{2}」)、最小限の数を指定する方法(2個以上であれば「{2, }」)、最小限と最大の数を指定する方法(2個以上4個以下であれば「{2,4}」)がある。 /a{2}/では、「aa」とマッチする。 /[ab]{2}/では、「aa」「ab」「bb」とマッチする。 /[aeiouy]{0,1}/では、母音が無い場合又は一つの場合とマッチする。これは/[aeiouy]?/と同じ。 /[aeiouy]{1,2}/では、母音が一つの場合又は二つの場合とマッチする。 |
次に、上記の検索式の内容を語頭部分から順番に見ていきます。始まりと終わりを示す「/」は省略します。
.*t?c[ch][aeiouy]{1,2}nd?[gj].*
順 番 | 音 | 入力例 | 入力例の意味・内容 |
---|---|---|---|
1 | .* | 調査対象文字「change」の直前にどんな文字もないもの、又は何らかの文字があるものがマッチする。「change」のように直前に何もないもの、「exchange」のように直前に文字があるものがマッチする。 | |
2 | ch | t?c[ch] | 最初の「ch」の音は、「change」の「ch」の他に「match」の「tch」、「inch」の「ch」、「bocci」(ボッチ)の「cc」のようなスペルが考えられる。ヘルプページの「Phonetic sounds」のパートでは、「CH」の音と近い音を検索するための式として「t?c[ch]」が示されている。この式を細かく見ると、「t?」では「tが0個又は1個出現するもの」、「c」はそのまま必ず出現するもの、「[ch]」では「c」か「h」のどちらかが1個出現するもの」がマッチするという意味となる。その結果、「tcc」「tch」「cc」「ch」のいずれかの文字列を持つものがマッチする。 |
3 | ei | [aeiouy]{1,2} | 次にくる母音では、「a, e, i, o, u, y」(母音)のうち1個以上2個以下持つものがマッチする。 |
4 | n | n | この部分にはバリエーションが想定されていないため、「n」の文字をそのまま入力する。検索式の「n」が置かれた位置に「n」という文字を有するものがマッチする。 |
5 | dʒ | d?[gj] | 最後の「ge」の音は、ヘルプページの「Phonetic sounds」のパートでは入力例として「d?[gj]」が示されている。この式を細かく見ると、「d?」では「dが0個又は1個出現するもの」、「[gj]」では「g」か「j」のどちらかが1個出現するもの」がマッチするという意味となる。その結果、「dg」「dj」「g」「j」のいずれかの文字列をもつものがマッチする。 |
6 | .* | 調査対象文字「change」の直後にどんな文字もないもの、又は何らかの文字があるものがマッチする。「change」のように直後に何もないもの、「changing」のように直後に文字があるものがマッチする。 |
実際に上記の検索式を入力窓に入力して検索ボタンを押すと、36,232件の商標がヒットしました。消滅しているものも含んでいるし、区分での絞り込みもしていないので、とてもたくさんの件数が検索結果として表示されました。通常なら、これから更に様々な条件で調査を重ねていき、調査結果の数を絞り込んでいくことになります。
(3)レゲックスの構文の別例
「Change」の称呼類似・スペル近似の商標を検索するためのレゲックスの検索式は幾通りも考えられますが、上記の例1で使用していない記号を使った例を次に挙げて解説します。実際の審査で使われたものの一部を抜粋しています。
【例2】 /.*ch.{1,2}n[gj].*/
【例3】 /.*[csxz]h*[aey]+n+[gj].*/
例2,例3で使われている記号の意味を次の表で示します(例1にあるものは除きます)。
記号 | 意 味 | 検索例など |
---|---|---|
. | 何らかの文字1個に置き換わる。 | /a. /では、「aa」「ab」「ac」などがマッチする。 例1では特定の「n」の文字であったが、例2では文字なら何でもよいので1文字分マッチさせるために「.」を使う。 例2の「ch.{1,2}」では、「.」の直後に、例1で解説した直前の要素の出現回数を指定する「{ }」があり、「{1,2}」と記載されているので、「.{1,2}」を一つのまとまりと捉えて「何らかの文字が1個以上2個まで出現する」という意味になる。「ch.{1,2}」からは「chin」「chic」「chef」「chap」「chat」などがマッチする。 |
* | 直前の要素を0個以上いくつでも繰り返す。※レゲックスで用いられる場合は量を指定するワイルドカードとなる。 | /ab*/では、「a」「ab」「abb」「abbbbbb」などがマッチする。 例3では、「h*」として使われている。この部分は「h」がない場合と「h」が1個以上繰り返される場合をカバーする。 尚、既に説明した「.*」は上の列の記号とこの列の記号が組み合わさったものなので、文字がまったくないか、又は何等かの文字が不定数あることを意味する。 |
+ | この記号の直前の要素が1個以上出現するという意味。 | /ab+/では、直前の要素である「b」が1個以上出現する「ab」「abb」「abbb」「abbbb」などがマッチする。 例3では、「[aey]+」となっており、直前の要素であるa, e, yのいずれか一つが1個以上出現するという意味なので、例えば「a」「ea」「ya」「eeey」などがマッチする。 |
3.調査スキルを上達させる一つの方法
レゲックスを使って類似商標調査を行うには、英語の発音や音声学に関する知識に加えて、調査結果を正しく絞り込むための調査テクニックや、商標が類似するかどうかの判断材料となる混同のおそれのテストにも精通する必要があるなど、ハードルは高そうです。しかし、簡単なものから経験を積んでいきスキルを身につけていけば、それほど難しいものではありません。
最後に米国商標の調査スキルを身につける方法を一つ紹介します。それば、審査官が審査で行った商標サーチの検索式を自分でも実際に行ってみることです。そのためには、米国商標調査システムがTESSから新システムに代わってからの米国商標出願の審査経過にアクセスする必要があります。検索内容は、各出願で保存されている経過書類の中の「Xsearch Search Summary」をクリックすると表示されます。検索式を調べてみたい商標の出願番号がわかっていれば出願番号で検索して、審査経過にアクセスします。
審査官が新システムを使ってサーチをした案件を特定するためには、フィールドタグサーチを使いましょう。2023年10月前後くらいから新システムが使われています(実際はもっと前から審査官はベータ版で使っています)。出願後、担当審査官が決まるまで一定の期間がかかります。適当にヤマをかけて2023年8月1日から2024年2月29日までに出願された商標で、現在も存続しているものとして、フィールドサーチを組み立ててみましょう。
入力する式は「FD:[2023-08-01 TO 2024-02-29] AND LD:true」となります。結果はかなり多いので、例えば出願人の住所国で絞り込む(「AND SC:japan」)か、あるいは、並べ替え「sort」メニューを使って「Serial (0-9)」のラジオボタンをマークして出願番号の若い順に並べ替えるなどします。絞り込みの方法は何でもよいです。そして自分が興味を持った出願の詳細情報にアクセスします。アクセスの仕方は、①調査結果として表示された商標のマーク部分をクリック、②右上の「View details」をクリック、③Trademark Status & Document Retrieval (TSDR)に移行したら「Documents」の薄青色のボタンをクリック、④出願経過の中から「Xsearch Search Summary」を探しクリック、です。そうすると調査内容が表示されます。調査した時期によっては、TESSを使ったサーチのものもあるかもしれないのでご注意ください。いろいろなサーチの仕方、絞り込みの仕方があることがわかります。いくつか試しているうちにコツのようなものがつかめてくると思います。
4.むすび
以上、USPTOの商標調査システムで利用可能なレゲックスサーチについて基本事項を紹介しました。これで新しい米国商標調査システムの使い方を三種類(ドロップダウンサーチ、フィールドタグサーチ、レゲックスサーチ)紹介しました。TESSはもう使えない過去のものになっていますので、新しいシステムに慣れるしかありません。実際に使ってみると、検索結果に商標見本も表示されて見やすくなった、クラウドベースとなったおかげでいつの間にかタイムアウトすることがなくなった、ユーザーの意見を取り入れて頻繁にアップデートされるなど、新システムの方がやはり多くの点で優れていて、使いやすいと思います。USPTOの公式解説動画や資料もとても親しみやすいのでおすすめです。
当事務所では、外国商標に関する様々なお困り事に対するサポートを行っています。レゲックスサーチのやり方が今一つわからない、身近に外国商標に詳しい人がいない、など外国商標についてお困り事がありましたら、お気軽に当事務所にご相談ください。ご相談はこちらのお問い合わせフォームから、お待ちしております。