[go: up one dir, main page]

DE60037681T2 - Verfahren zum automatischen und gesicherten suchen von daten mit hilfe eines datenübertragungsnetzwerks - Google Patents

Verfahren zum automatischen und gesicherten suchen von daten mit hilfe eines datenübertragungsnetzwerks Download PDF

Info

Publication number
DE60037681T2
DE60037681T2 DE60037681T DE60037681T DE60037681T2 DE 60037681 T2 DE60037681 T2 DE 60037681T2 DE 60037681 T DE60037681 T DE 60037681T DE 60037681 T DE60037681 T DE 60037681T DE 60037681 T2 DE60037681 T2 DE 60037681T2
Authority
DE
Germany
Prior art keywords
data
fields
database
downloaded
criteria
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60037681T
Other languages
English (en)
Other versions
DE60037681D1 (de
Inventor
Daniel Vinseonneau
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
VIGILINT (SOFTWARE) HOLDINGS Ltd
VIGILINT SOFTWARE HOLDINGS Ltd
Original Assignee
VIGILINT (SOFTWARE) HOLDINGS Ltd
VIGILINT SOFTWARE HOLDINGS Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by VIGILINT (SOFTWARE) HOLDINGS Ltd, VIGILINT SOFTWARE HOLDINGS Ltd filed Critical VIGILINT (SOFTWARE) HOLDINGS Ltd
Application granted granted Critical
Publication of DE60037681D1 publication Critical patent/DE60037681D1/de
Publication of DE60037681T2 publication Critical patent/DE60037681T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

  • Technischer Bereich:
  • Die vorliegende Erfindung betrifft die Verfahren und Systeme von Dokumentensuche, wobei ein Benutzer mittels eines lokalen Servers Zugang zu einem Datenübertragungsnetz, zu Datenbanken, die dank Netzwerkservern zugänglich sind, hat, wobei die Daten auf von dem Benutzer definierte Kriterien reagieren und anschließend heruntergeladen werden, um in einer Datenbank gespeichert zu werden, die mit dem lokalen Server verbunden ist.
  • Stand der Technik:
  • Es ist eine große Anzahl an Datenbeständen vorhanden, die Zugang zu verschiedensten Informationen wie Patenten, Börsenkursen, Flugbuchungen, ... usw. bieten. Diese Datenbestände sind im Allgemeinen über Internet oder durch Direktverbindung über das Fernsprechnetz zugänglich. Es ist somit möglich, einen Datenbestand abzufragen, entweder durch Eingeben der Anfragen über die Tastatur oder durch Verwenden einer Datei, die mindestens eine Anfrage enthält, die als automatisches Anfrageskript bezeichnet wird. Die resultierenden Daten werden entweder interaktiv oder ausgedruckt dargestellt oder für eine nachfolgende Konsultation in einer Datei gesichert.
  • In dem Artikel „Naviating with a Web Compass", von Rex Paul BALDAZO (Byte, US, Mcgraw-Hill Inc. St Peterborough, Bd. 21, Nr. 3, 1. März 1996, S. 97–98, XP00600179, ISSN: 0360-5280), wird eine Software offenbart. Diese Software wird unter dem Namen „Web Compass" auf den Markt gebracht. Dieses Hilfsmittel „Web Compass" ist angepasst, um in Interaktion mit mehreren Suchsystemen zu arbeiten. Dies bedeutet, dass die Software „Web Compass" die Suchen nicht selbst durchführt, sondern existierende systeme wie etwa LYCOS oder YAHOO verwendet. Mit dem System „Web Compass" gibt der Benutzer zum Beispiel Schlüsselwörter an und gibt ebenfalls an, welche Datenbestände benutzt werden müssen, um die gesuchten Informationen wiederzuerlangen. Nach Erhalt der Ergebnisse kann die Software „Web Compass" verwendet werden, um die wiedererlangten Informationen zu strukturieren. Eins der Hilfsmittel der Software „Web Compass" ermöglicht das Restrukturieren der wiedererlangten Information und das Lokalisieren dieser in einem lokalen Server. Die Software „Web Compass" kann so installiert werden, dass derartige Suchen zum Beispiel täglich und automatisch durchgeführt werden können, und die neuen Informationen an einem bestimmten Ort des lokalen Servers lokalisieren.
  • Eine oft verwendete Art von Datenbeständen umfasst Datenbanken, die Patentveröffentlichungen enthalten, die derzeit 80% der in der Welt vorhandenen geschriebenen Informationen ausmachen. Die Patentdatenbanken können in zwei Familien klassifiziert werden: die allgemeinen Datenbanken, die aus einem Dokumentinhalt erstellt werden, wobei die Informationen pro Familie umgruppiert werden. Diese Art von Datenbanken ermöglicht, die Anzahl an Artikeln zu beschränken, während das Lesen in einer bestimmten Sprache gefördert wird. Das ist der Fall bei der ESPACENET-Datenbank des Europäischen Patentamts, wo die bibliografischen Informationen ins Englische übersetzt sind. Die nationalen Datenbanken sind hingegen auf Patente eines angeführten Lands (Frankreich, Deutschland) beschränkt, sind allerdings insofern vollständiger als die bereitgestellte Information zum Beispiel das Patent in seiner Gesamtheit ist. Die Suche besteht folglich aus der Ausführung einer ersten Anfrage über eine allgemeine Datenbank der Art ESPACENET zum Auswählen der Veröffentlichungsnummern, anschließend aus der Ausführung einer zweiten Anfrage über eine oder mehrere nationale Datenbanken zum Erhalten von vollständigeren Informationen.
  • Obwohl verschiedenes Herunterladen, das dasselbe Themengebiet betrifft, in den Patentdatenbanken mit Beseitigung von Duplikaten und schließlich Beseitigung von Patenten außerhalb des Themengebiets umgruppiert werden kann, ist jede im WEB im Netz des Internets durchgeführte Anfrage unabhängig. Die erhaltenen HTML-Seiten sind ebenfalls unabhängig. Der Benutzer verfügt folglich über keine synthetische Information.
  • Die aktuelle Art und Weise, die Datenbanken abzufragen und insbesondere die Datenbanken, die sich auf Patente beziehen, stellt folglich hinsichtlich der Industrie keine große Wirksamkeit dar. Die Daten, die resultierend aus einer Suche im Netz des Internets empfangen werden, brauchen lange, um erhalten zu werden, sind schwer zu konsultieren und zu manipulieren und sind mitunter fehlerhaft. Diese Nachteile rühren von der Tatsache her, dass jede Anfrage eine manuelle Anfrage ist und auf einen einzigen Abfrageprozess beschränkt ist, was erzwingt, dass die Anzahl dieser manuellen Anfragen multipliziert wird.
  • Schließlich ist ein Hauptnachteil der durchgeführten Datensuchverfahren der Mangel an Vertraulichkeit. In der Tat besitzt ein Informationsserver eine Log-Datei, die ermöglicht, den Inhalt der laufenden Anfragen darzustellen. Die verwendete IP-Adresse selbst ist dem Server ebenfalls bekannt. Eine boshafte Person kann folglich durch die Darstellung einer Anfrage das Themengebiet kennen, auf dem derjenige arbeitet, der den Server abfragt.
  • Offenbarung der Erfindung:
  • Das Ziel der Erfindung besteht folglich darin, ein automatisiertes Datensuchverfahren in den über ein Datenübertragungsnetz zugänglichen Datenbanken zu realisieren, was schnellen und wirksamen Zugang zu einer Vielzahl von Datenbanken ermöglicht, ohne eine Unzahl von manuellen Anfragen formulieren zu müssen.
  • Ein anderes Ziel der Erfindung besteht ebenfalls darin, in den über ein Datenübertragungsnetz zugänglichen Datenbanken ein gesichertes Datensuchverfahren zu realisieren, wobei die ursprüngliche Anfrage eine allgemeine Befehlsanfrage ist, die den Erhalt genauer Informationen über die Kriterien der Suche nicht ermöglicht.
  • Gemäß einem ersten Ziel betrifft die Erfindung folglich ein Verfahren zur Suche von Daten, die in mindestens einer Datenbank (32, 34), die durch mindestens einen externen Server eines Datenübertragungsnetzes (14) zugänglich ist, gespeichert sind, das darin besteht, für jede Datenbank eine Anfrage (36) von einem lokalen Server (10), der mit mindestens einer lokalen Datenbank (12) verbunden ist, zu stellen, wobei die Anfrage Felder umfasst, die erste Kriterien bezüglich der Art von gesuchten Informationen und bezüglich des Inhalts der Informationen und/oder bezüglich der Datumsangaben, die mit den Informationen verbunden sind, enthalten, wobei die ersten Felder durch boolesche Operatoren verknüpft werden können, und anschließend die Daten, die auf die ersten Kriterien von dem externen Server reagieren, auf den lokalen Server herunterzuladen;
    wobei das Verfahren dadurch gekennzeichnet ist, dass der Schritt des Herunterladens die folgenden Schritte umfasst:
    • – Erzeugung (90) von Skripten durch den lokalen Server, die aus einer Reihe von Befehlen zusammengesetzt sind, die auf den ersten Kriterien basieren und gemäß denen erste Zeiger, die zweite Felder von herunterzuladenen Daten identifizieren, generiert werden, und
    • – Aktivierung von Automaten durch Prozesse, die sich der Skripte bedienen und ermöglichen, dass die zweiten Datenfelder, auf die die ersten Zeiger zeigen, sowie andere Datenfelder, die durch vordefinierte Beziehungen mit den zweiten Feldern von Daten, auf die gezeigt wird, verbunden sind, heruntergeladen (92) werden, wobei das Verfahren dadurch gekennzeichnet ist, dass es des Weiteren, nachdem die Daten, die auf die ersten Kriterien reagieren, von dem externen Server auf den lokalen Server heruntergeladen wurden, einen Schritt (94) der syntaktischen Analyse der heruntergeladenen Daten gemäß zweiten spezifischen Kriterien, die sich von den ersten Kriterien unterscheiden, um neue spezifische Datenfelder wiederzuerlangen oder zu generieren, und einen Schritt der Generierung von zweiten Zeigern für diese neuen spezifischen Datenfelder der heruntergeladenen Daten, bevor die heruntergeladenen Daten und die zweiten Zeiger in der lokalen Datenbank gespeichert (98) sind, umfasst.
  • Kurze Beschreibung der Figuren:
  • Die Ziele, Gegenstände und Merkmale der vorliegenden Erfindung werden beim Durchlesen der nachfolgenden Beschreibung unter Bezugnahme auf die Zeichnungen deutlicher, in denen:
  • 1 schematisch ein Datenübertragungsnetz zeigt, an das ein lokaler Server und zwei externe Server mit Datenbanken angeschlossen sind, wobei der Benutzer, der mit dem lokalen Server verbunden ist, gemäß dem Verfahren der Erfindung Zugang erhalten möchte,
  • 2 ein Blockdiagramm ist, das das Implementierungssystem des Verfahrens gemäß der Erfindung zeigt,
  • 3 ein Beispiel einer Anfrage, das in dem Verfahren gemäß der Erfindung verwendet werden kann, zeigt,
  • 4 ein Beispiel einer Auswahlseite, das in dem Verfahren gemäß der Erfindung verwendet werden kann, zeigt,
  • 5 ein Beispiel einer Abfrageseite, das in dem Verfahren gemäß der Erfindung verwendet werden kann, zeigt, und
  • 6 ein Organigramm ist, das die unterschiedlichen Schritte, die in dem Verfahren gemäß der Erfindung implementiert wurden, zeigt.
  • Detaillierte Beschreibung der Erfindung:
  • Wie in 1 dargestellt, kann das Verfahren gemäß der Erfindung in einem lokalen Server 10 implementiert werden, der über eine lokale Datenbank 12 verfügt, wobei der lokale Server an ein Netz 14 wie etwa ein Netz der IP-Art und insbesondere das Netz des Internets angeschlossen ist. Der lokale Server 10 erlaubt Zurücksenden von Datensuchanfragen an die externen Server 16 und 18, die über entsprechende Datenbanken 20, 22, 24 und Datenbanken 26, 28 verfügen. Es sei bemerkt, dass die lokale Datenbank 12 durch mehrere Datenbanken ersetzt werden könnte, ohne den Bereich der Erfindung zu verlassen.
  • Das allgemeine Blockdiagramm der Erfindung ist in 2 dargestellt. In der weiteren Beschreibung wird das Verfahren der Erfindung auf die Suche von Informationen in den Patentdatenbanken angewandt. Auf der Benutzeroberfläche 29, die im Allgemeinen eine Workstation ist, wird beim Öffnen des verwendeten Navigators auf der Anzeigevorrichtung des lokalen Servers eine Homepage 30 angezeigt. Diese Homepage zeigt ein oder mehrere Formulare an, um entsprechend Zugang zu einer oder mehreren externen Datenbanken 32, 34 zu erhalten, wobei jedes Formular dazu bestimmt ist, eine Anfrage 36 an die ausgewählte Datenbank zu bilden. Es sei bemerkt, dass eine Datenbank ebenfalls über mehrere Formulare zugänglich sein könnte.
  • Die Anfrage 36 kann eine einfache Patentliste oder jede andere Liste wie etwa alle Patente eines bestimmten Erfinders oder einer bestimmten Firma sein. Hochentwickeltere Suchkriterien wie etwa Suchen nach Wörtern oder Text können unter Verwendung von booleschen Operatoren auf vorbestimmten oder nicht vorbestimmten Feldern verwendet werden.
  • 3 beschreibt Elemente, die auf den externen Datenservern für eine Suche der Art Text verwendet werden können. Die Möglichkeiten der Anfrage werden tatsächlich gemäß den Möglichkeiten jedes Servers angepasst, bewahren allerdings gewisse gemeinsame Benutzeroberflächen. Die vorbestimmten Modelle vereinfachen somit die Benutzeroberfläche. Das vorgeschlagene Beispiel enthält ein erstes Paar Felder 38 und 40, bzw. ein Textfeld in natürlicher Sprache und eine Art von verbundenem Feld, in dem Suchen durchgeführt werden möchten. Gemäß den Servern können die booleschen Operatoren in den Text integriert werden. Ein zweites Paar 42 und 44 kann ebenfalls optional verwendet und durch einen booleschen Operator 46 mit dem ersten Paar in Korrelation gebracht werden. Schließlich kann ein Datumsangabefeld 48 ebenfalls definiert werden, um die Suchen einzuschränken. Die Liste der Felder ist nicht vollständig. Gemäß den Servern können andere Merkmale verwendet werden.
  • Sobald die Felder in der Anfrage definiert sind, überträgt der „Eingabe"-Befehl oder die Auswahl einer spezifischen Schaltfläche der Benutzeroberfläche 29 diese Anfrage an den Server, der mit der in Betracht gezogenen Datenbank verbunden ist. Da der Server in einer Sprache arbeiten kann, die nicht die gewöhnliche Sprache des Benutzers ist, kann eine Konvertierung in die gewünschte Sprache getätigt werden, um die Erzeugung der Anfrage zu vereinfachen, die folglich von dem Erzeugungssystem umgewandelt wird.
  • Die externe Datenbank 32 oder 34 sendet folglich aus der Suche stammende Daten, die ebenfalls in die Sprache des Benutzers umgewandelt werden können, zurück. Die Antworten liegen tatsächlich in der Form von Hypertextlinks und Seiten, die mittels eines Navigators in dem lokalen Server interaktiv zugänglich sind, vor.
  • In dieser Phase wählt der Benutzer auf einer Auswahlseite 50, die zum Beispiel in einem Bereich der Homepage 30 der Benutzeroberfläche 29 angezeigt wird, die Art von Daten, die er herunterladen möchte, in HTML aus. Diese Auswahlseite, die in 4 dargestellt ist, enthält im Allgemeinen die Elemente, die interessant sind, herunterzuladen, die die Titelseite 51, die Zitationen 52, die Zeichnungen 54, die Ansprüche 56 und die Beschreibung 58 sind. Ein angehängtes Feld 60 ermöglicht, zu definieren, zu welchem Zeitpunkt (Uhrzeit, Datum) das Herunterladen durchgeführt wird.
  • Der Benutzer startet anschließend die Folge des Herunterladens durch Klicken auf die entsprechende Taste. Die Aktion des Herunterladens beginnt mit der Erzeugung von Skripten, die aus einer Reihe von Befehlen zusammengesetzt sind, die auf den Suchkriterien der Anfrage basieren und die die Generierung von Zeigern ermöglichen, die die herunterzuladenen Datenfelder identifizieren. Diese Skripte dienen den Prozessen 62, 64, die entsprechend mit den Datenbanken 32 und 34 verbunden sind, um in den Datenbanken die Informationen zu beschaffen. Jeder Prozess setzt elektronische Automaten 66, 68 für den Prozess 62 oder 70 für den Prozess 64 ein, deren Anzahl von dem Umfang oder der Quantität der gesuchten Daten abhängt. Somit ist es möglich, dass eine Anzahl an Automaten, zwischen 10 und 100, die parallel arbeiten, dieselbe Datenbank abfragen. Wenn zum Beispiel die Anzahl an Antworten auf die Anfrage höher als 10.000 ist, während die Anzahl an Antworten, die von dem Server bereitgestellt werden können, auf 500 beschränkt ist, werden viele Automaten benötigt, durch Auswählen von Fenstern von Veröffentlichungsdaten für jeden Automaten durch Hinzufügen von logischen UNDs. Es können somit logische UNDs vorgesehen werden, die sich in Kombination auf mehrere Felder erstrecken. Somit bleibt jeder Automat in der autorisierten Abgrenzung, und die Ergebnisse sind vollständig und nicht partiell, was bei einem herkömmlichen Verfahren der Fall gewesen wäre, und werden dem Benutzer auf gänzlich transparente Art und Weise bereitgestellt.
  • Die elektronischen Automaten führen ihre Arbeit als Hintergrundaufgabe außerhalb des Navigators des Servers durch. Dies wird dadurch ermöglicht, dass jede Datenbank über bekannte Anzeigeformate verfügt, die den Automaten ermöglichen, anzufangen, die unterschiedlichen Seiten eines Patents einfach wieder zu finden. Dies verlangt ein Minimum einer syntaktischen Analyse, um die benötigten Informationen zu entnehmen, um Zugang zu den folgenden Seiten erhalten zu können. Zum Beispiel generiert die USPTO-Datenbank der US-Patente provisorische Verzeichnisse für jede Anfrage. Des Weiteren bestimmen die Automaten die Anzahl an Seiten von Patenten und den Standort, die Nummern der Seiten der Zeichnungen durch Lesen der zugrunde liegenden Information auf einer Seite des Patents. Mit anderen Worten führen die Automaten das Herunterladen der von den Zeigern gezeigten Datenfelder durch, die in den Skripten generiert werden, aber auch das Herunterladen anderer Datenfelder, die mit den von durch vordefinierte Beziehungen gezeigten Datenfeldern verbunden sind. Gemäß einer Variante kann vorgesehen werden, nur Datenfelder herunterzuladen, die sich noch nicht in der lokalen Datenbank befinden, um den Umfang an herunterzuladenen Daten zu minimieren.
  • Nach der Phase des Herunterladens werden die verschiedenen heruntergeladenen Seiten von einer Einheit für syntaktische Analyse oder Parsing analysiert, um Datenfelder wie etwa die Nummer eines Patents, sein Veröffentlichungsdatum, den Namen des Erfinders ... wieder zu finden oder zu generieren. Dieser Schritt kann parallel mit dem Schritt des Herunterladens durchgeführt werden, sobald hinreichende Daten verfügbar sind, um mindestens ein Patent abzuhandeln. Es kann sich also der von dem Auswertungsgerät 72 bereitgestellten Daten, wie Daten für das Senden einer neuen Anfrage, bedient werden. Zum Beispiel können Nicht-US-Patente, die in der USPTO-Datenbank für ein US-Patent zitiert sind, ausgewählt werden, und diese Patente können in der ESPACENET-Bank gesucht werden. Oder aber die Analyse von verschiedenen Erweiterungen eines Patents kann zum Wählen der besten Quelle für einen gegebenen Mandanten führen.
  • Sobald das Verfahren der syntaktischen Analyse für mindestens ein Patent durchgeführt ist, wird die lokale Datenbank 12 durch Informieren der Felder für jedes Patent gespeist. Es versteht sich, dass der Gegenstand des Patents in der lokalen Datenbank eine große Anzahl an Feldern umfasst. Es handelt sich um die separate Verknüpfung (im mathematischen Sinn des Begriffs) der verfügbaren Felder auf jeder zugänglichen Datenbank. Zum Beispiel: die US- Patente in der ESPACENET-Datenbank enthalten nicht die US-Zuordnungscodes, und diese gleichen Patente in dem USPTO-Datenbestand enthalten weder die Erweiterungen, noch den ECLA-Code.
  • Schließlich umfasst die Homepage 30 auf der Benutzeroberfläche 29 ebenfalls eine Abfrageseite 74 zum unmittelbaren Abfragen oder nicht der lokalen Datenbank 12.
  • Diese Seite zeigt ein Kästchengitter zum Informieren an. Jedes Kästchen entspricht einem in der Datenbank vorhandenen Patentfeld (zum Beispiel internationale Klassifikation, US-Klassifikation, Anmelder, ...). Es kann ein zusätzliches Kästchen zum Eintragen, falls gewünscht, der Nummer des Herunterladens vorhanden sein. Es kann ebenfalls ein letztes Kästchen zum direkten Eintragen einer Anfrage in SQL-Sprache oder des Namens einer SQL-Datei mit vorprogrammierten Fragen (SQL-Skript) vorhanden sein. Es können logische Operatoren zwischen den Feldern angewandt werden. Es können ebenfalls Anzeige- und Zuordnungsparameter der gesuchten Information angegeben werden (zum Beispiel Sortierung nach Firma, Sortierung nach Veröffentlichungsdatum...). Diese Parameter ermöglichen Anzeige und/oder Umgruppierung der Patente unter sich in einem oder mehreren Baumdiagrammen, die definiert werden können und wo mittels Hyperlinks Verschiebungen auftreten können.
  • Eine Abfrageseite umfasst im Allgemeinen die vollständige Liste der in 5 dargestellten Felder: die Patentnummer, den Titel, den oder die Erfinder, den Anmelder, das Erteilungsdatum, das Veröffentlichungsdatum, die Zusammenfassung, die Ansprüche, die Beschreibung, die US-Klassifikation, die zitierten Patente, die internationale Klassifikation, die ECLA-Klassifikation, das Prioritätsland, die Prioritätsnummer, die Familie, den Anmeldetag sowie die Anmeldenummer, den Patentanwalt und schließlich den Namen des ersten Prüfers. Diese Liste ist lediglich ein Beispiel, und es können neue Elemente hinzugefügt werden.
  • Um das Verfahren gemäß der Erfindung gut zu verstehen, sind die verschiedenen Schritte des Verfahrens in 6 repräsentiert. Nach der Anzeige der Homepage (76) auf der Benutzeroberfläche muss der Benutzer bestimmen, ob er wünscht, eine Anfrage oder eine Abfrage der lokalen Datenbank (78) zu tätigen. Wenn es sich um eine Anfrage handelt, wird diese durch das Übertragungsnetz an den ausgewählten externen Server (80) gesendet. Dort werden anschließend gesuchte HTML-Seiten (82) angezeigt.
  • Dann wählt der Benutzer die Art von Information aus, die er herunterladen möchte, indem er die Auswahlseite (84) informiert. Wie zuvor gesehen, kann auf der Auswahlseite ein Anhangfeld vorgesehen sein, um zu definieren, ob das Herunterladen abweichend ist oder nicht (86). Dies entspricht einem Stapelbetrieb, der verhindert, dass das Netz und der Server gemäß der Relevanz des Herunterladens saturiert werden. Ein anderes Interesse dieses abweichenden Herunterladens besteht darin, jedes den Server betreffende Herunterladen umzugruppieren, was das Ziel der Anfrage noch mehr maskiert. Wenn das Herunterladen abweichend sein soll, wird ein Zeitzähler in Betrieb genommen (88), und lediglich nach Ablauf einer vorbestimmten Zeit wird das Verfahren fortgesetzt.
  • Nachdem die Entscheidung des Herunterladens getroffen ist, ist der folgende Schritt die Erzeugung der Skripte (90), gefolgt von dem eigentlichen Herunterladen durch die elektronischen Automaten (92). Anschließend führt das Verfahren weiter zu dem Schritt der syntaktischen Analyse oder Parsing (94), was ermöglicht, neue Datenfelder (96) zu definieren. Es sei bemerkt, dass diese Datenfelder wiederum als Suchfelder bei einer neuen Anfrage derselben Datenbank oder einer anderen Datenbank verwendet werden können. Anschließend werden die heruntergeladenen Datenfelder und die Zeiger zu den neuen Datenfeldern, die bei dem Schritt des Parsing definiert werden, in der lokalen Datenbank (98) gespeichert. In dieser Phase ist es möglich, eine unmittelbare Abfrage in der lokalen Datenbank durchzuführen oder nicht (100). Wenn dies nicht der Fall ist, kehrt der Prozess zu der Anzeige der Homepage (76) zurück. Wenn der Benutzer eine unmittelbare Abfrage wünscht, was im Allgemeinen der Fall ist, wird die Abfrageseite informiert (102), und eine strukturierte Anzeige der von der Abfrageseite ausgewählten Datenfelder findet auf der Benutzeroberfläche (104) statt.
  • Wenn die Daten in der lokalen Datenbank (98) gespeichert sind, werden sie in eine SQL-Folge konvertiert. Wenn eine Abfrage stattfindet, werden die Ursprungsdaten der lokalen Datenbank in eine HTML-Seite konvertiert, die einen Index und das Abfragegitter der Abfrageseite beinhaltet. Dieser Index ist eine Abfolge von Hyperlinks (gefundene Patentnummern und -titel usw., siehe Anzeigeparameter) zu einem Prozess, der ermöglicht, den Inhalt eines Patents anzuzeigen. Es wird zudem das SQL-Skript der Anfrage angezeigt, bevor es modifiziert oder in einer Datei archiviert werden kann. Mit jeder Abfrage ist eine Nummer verbunden, was ermöglicht, mehrere Anfragen untereinander zu kombinieren. Diese Nummer und die entsprechenden SQL-Skripte werden bei Ende der Sitzung nach Wahl des Benutzers vernichtet oder erhalten. In Bezug auf den Prozess der Abfrage der lokalen Datenbank kann eine Wiederholung vollzogen werden, um die Anfrage aufzufrischen. Es ist möglich, das Ergebnis der Anfrage in ein Verzeichnis zu exportieren, um zum Beispiel das Brennen einer CD-ROM, die Erzeugung einer Druck-Intranetseite zu ermöglichen.
  • Die vorhergehende Beschreibung zeigt, dass das Verfahren der Erfindung (und das System, das seine Implementierung ermöglicht), dank der Verwendung einer Vielzahl von Automaten, die simultan in derselben Datenbank, in mehreren Datenbanken desselben Servers oder in Datenbanken von verschiedenen Servern arbeiten können, ermöglicht, auf automatische, wirksame und schnelle Art und Weise Daten zu sammeln. Zudem ist das Verfahren der Erfindung gesichert, da die genaueste Suche niemals auf externen Servern getätigt wird, sondern auf dem lokalen Server, obwohl das Herunterladen auf der Gesamtheit der Daten durchgeführt wird. Es ist folglich möglich, eine allgemeine Befehlsanfrage mit nur einem Wort oder einem Zuordnungscode zu tätigen und alle Patente, die Auf dieses Kriterium reagieren, herunterzuladen. Nachdem die heruntergeladenen Patente dann von einem syntaktischen Auswertungsgerät analysiert wurden, kann die lokale Datenbank nun in voller Vertraulichkeit abgefragt werden, um genaue Daten zu erhalten.
  • Änderungen an dem zuvor beschriebenen Verfahren können vorgenommen werden, ohne den Bereich der Erfindung zu verlassen. Somit kann eine durchgeführte Anfrage später regelmäßig aktualisiert werden, zum Beispiel jeden Monat, um die auf den externen Servern getätigten Aktualisierungen automatisch zu erfassen. Dafür reicht es aus, in dem Datumsangabenfeld der Anfrage (siehe 3) die automatische Aktualisierungsfunktion mit der optionalen Frequenz der Aktualisierung zu definieren. Somit wird die lokale Bank ein Abbild der externen Datenbanken und nur unbedeutend abweichend sein. Folglich wird eine Nachricht für den Benutzer erzeugt, um ihn über jede Aktualisierung zu benachrichtigen.

Claims (12)

  1. Ein Verfahren zur Suche von Daten, die in mindestens einer Datenbank (32, 34), die durch mindestens einen externen Server eines Datenübertragungsnetzes (14) zugänglich ist, gespeichert sind, das darin besteht, für jede Datenbank eine Anfrage (36) von einem lokalen Server (10), der mit mindestens einer lokalen Datenbank (12) verbunden ist, zu stellen, wobei die Anfrage erste Felder umfasst, die erste Kriterien bezüglich der Art von gesuchten Informationen und bezüglich des Inhalts der Informationen und/oder bezüglich der Datumsangaben, die mit den Informationen verbunden sind, enthalten, wobei die ersten Felder durch boolesche Operatoren verknüpft werden können, und anschließend die Daten, die auf die ersten Kriterien von dem externen Server reagieren, auf den lokalen Server herunterzuladen; wobei das Verfahren dadurch gekennzeichnet ist, dass der Schritt des Herunterladens die folgenden Schritte umfasst: – Erzeugung (90) von Skripten durch den lokalen Server, die aus einer Reihe von Befehlen zusammengesetzt sind, die auf den ersten Kriterien basieren und gemäß denen erste Zeiger, die zweite Felder von herunterzuladenen Daten identifizieren, generiert werden, und – Aktivierung von Automaten durch Prozesse, die sich der Skripte bedienen und ermöglichen, dass die zweiten Datenfelder, auf die die ersten Zeiger zeigen, sowie andere Datenfelder, die durch vordefinierte Beziehungen mit den zweiten Feldern von Daten, auf die gezeigt wird, verbunden sind, heruntergeladen (92) werden, wobei das Verfahren dadurch gekennzeichnet ist, dass es des Weiteren, nachdem die Daten, die auf die ersten Kriterien reagieren, von dem externen Server auf den lokalen Server heruntergeladen wurden, einen Schritt (94) der syntaktischen Analyse der heruntergeladenen Daten gemäß zweiten spezifischen Kriterien, die sich von den ersten Kriterien unterscheiden, um neue spezifische Datenfelder wiederzuerlangen oder zu generieren, und einen Schritt der Generierung von zweiten Zeigern für diese neuen spezifischen Datenfelder der heruntergeladenen Daten, bevor die heruntergeladenen Daten und die zweiten Zeiger in der lokalen Datenbank gespeichert (98) sind, umfasst.
  2. Verfahren gemäß Anspruch 1, wobei die spezifischen Datenfelder, die durch den Schritt der syntaktischen Analyse (Parsing) generiert werden, verwendet werden, um eine neue Anfrage für die gleiche Datenbank oder eine andere Datenbank zu stellen.
  3. Verfahren gemäß einem der Ansprüche 1, 2 oder 3, das des Weiteren einen Auswahlschritt auf einer HTML-Auswahlseite (50) auf der Benutzeroberfläche umfasst, wobei dem Benutzer ermöglicht wird, gewisse zweite Datenfelder, die auf die ersten Kriterien reagieren, auszuwählen.
  4. Verfahren gemäß Anspruch 3, wobei die Auswahlseite (50) ein zugehöriges Feld beinhaltet, das die Uhrzeit und/oder die Datumsangabe enthält, an dem der Schritt des zeitlich versetzten Herunterladens ausgeführt wurde.
  5. Verfahren gemäß einem der Ansprüche 1 bis 4, wobei die Anzahl an Automaten, die für den Schritt des Herunterladens aktiviert sind, von dem Volumen der gesuchten Daten abhängt, so dass die Quantität an von den Automaten heruntergeladenen Daten nicht durch Parameter, die mit der Datenbank, auf der sich die Daten befinden, verbunden sind, beschränkt ist.
  6. Verfahren gemäß Anspruch 5, wobei jeder der Automaten die Aufgabe hat, eine syntaktische Analyse der Seiten der herunterzuladenen Daten auszuführen, um die notwendigen Informationen für die Wiederbeschaffung der Daten, die zu den Daten der Datenseiten subsidiär sind oder darunter liegen, zu entnehmen.
  7. Verfahren gemäß einem der Ansprüche 1 bis 5, das des Weiteren einen Befragungsschritt mittels einer Befragungsseite (74) auf der Benutzeroberfläche (29) umfasst, was dem Benutzer ermöglicht, zu in der lokalen Datenbank (12) gespeicherten Datenfeldern zu gelangen.
  8. Verfahren gemäß Anspruch 7, wobei die Befragungsseite (74) die Identifizierung der Datenfelder beinhaltet, die von dem Benutzer ausgewählt werden können, um auf der Benutzeroberfläche angezeigt zu werden, wobei die Datenfelder durch logische Operatoren verknüpft werden können.
  9. Verfahren gemäß Anspruch 8, wobei die ausgewählten Informationen auf der Befragungsseite automatisch in SQL-Sprache konvertiert werden, bevor sie auf die lokale Datenbank (12) übertragen werden.
  10. Verfahren gemäß einem der vorhergehenden Ansprüche, wobei die Anfrage (36) ein Datenfeld beinhaltet, um regelmäßig aktualisiert zu werden, so dass die Aktualisierungen in den externen Datenbanken (32, 34) automatisch erfasst werden.
  11. Verfahren gemäß einem der vorhergehenden Ansprüche, wobei die externen Datenbanken (32, 34) Patentdatenbanken sind.
  12. Ein System zur Suche von Daten in den externen Datenbanken, das Mittel umfasst, die angepasst sind, um die Schritte des Verfahrens gemäß einem der vorhergehenden Ansprüche zu implementieren.
DE60037681T 2000-05-23 2000-05-23 Verfahren zum automatischen und gesicherten suchen von daten mit hilfe eines datenübertragungsnetzwerks Expired - Lifetime DE60037681T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/FR2000/001407 WO2001090934A1 (fr) 2000-05-23 2000-05-23 Procede de recherche de donnees automatise et securise au moyen d'un reseau de transmission de donnees

Publications (2)

Publication Number Publication Date
DE60037681D1 DE60037681D1 (de) 2008-02-14
DE60037681T2 true DE60037681T2 (de) 2009-01-02

Family

ID=8846654

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60037681T Expired - Lifetime DE60037681T2 (de) 2000-05-23 2000-05-23 Verfahren zum automatischen und gesicherten suchen von daten mit hilfe eines datenübertragungsnetzwerks

Country Status (5)

Country Link
US (1) US7043482B1 (de)
EP (1) EP1290578B1 (de)
AU (1) AU2000252256A1 (de)
DE (1) DE60037681T2 (de)
WO (1) WO2001090934A1 (de)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0012790D0 (en) * 2000-05-25 2000-07-19 Breakertech Inc Trusted search capability in a digital rights management environment
GB2400707B (en) * 2000-05-25 2004-12-29 Sealedmedia Ltd Search engine and digital rights management
US6925608B1 (en) * 2000-07-05 2005-08-02 Kendyl A. Roman Graphical user interface for building Boolean queries and viewing search results
US8010800B2 (en) 2001-06-26 2011-08-30 Sealedmedia Limited Search engine and digital rights management
US8127217B2 (en) 2002-04-19 2012-02-28 Kabushiki Kaisha Toshiba Document management system for transferring a plurality of documents
US20050141028A1 (en) * 2002-04-19 2005-06-30 Toshiba Corporation And Toshiba Tec Kabushiki Kaisha Document management system for automating operations performed on documents in data storage areas
DE10304277A1 (de) * 2003-02-03 2004-08-19 Siemens Ag Verfahren zur Steuerung einer Vermittlungseinrichtung
US8930402B1 (en) * 2005-10-31 2015-01-06 Verizon Patent And Licensing Inc. Systems and methods for automatic collection of data over a network
KR100924159B1 (ko) 2007-03-08 2009-10-28 주식회사 케익소프트 링크 추출 모듈 및 그 방법
US8010779B2 (en) * 2007-09-19 2011-08-30 Novell Inc. Techniques for secure network searching
US20200320210A1 (en) * 2019-04-08 2020-10-08 International Business Machines Corporation Database with security row tables
CN110765153B (zh) * 2019-10-08 2023-09-29 深圳市前海拾车道信息技术有限公司 一种基于车辆报废查询预警系统及方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5278980A (en) * 1991-08-16 1994-01-11 Xerox Corporation Iterative technique for phrase query formation and an information retrieval system employing same
JPH0756933A (ja) * 1993-06-24 1995-03-03 Xerox Corp 文書検索方法
DE69423838T2 (de) * 1993-09-23 2000-08-03 Xerox Corp., Rochester Semantische Gleichereignisfilterung für Spracherkennung und Signalübersetzungsanwendungen
US5576954A (en) * 1993-11-05 1996-11-19 University Of Central Florida Process for determination of text relevancy
US5642502A (en) * 1994-12-06 1997-06-24 University Of Central Florida Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text
US5577241A (en) * 1994-12-07 1996-11-19 Excite, Inc. Information retrieval system and method with implementation extensible query architecture
US5640553A (en) * 1995-09-15 1997-06-17 Infonautics Corporation Relevance normalization for documents retrieved from an information retrieval system in response to a query
US5842212A (en) * 1996-03-05 1998-11-24 Information Project Group Inc. Data modeling and computer access record memory
US5913214A (en) 1996-05-30 1999-06-15 Massachusetts Inst Technology Data extraction from world wide web pages
US5920854A (en) * 1996-08-14 1999-07-06 Infoseek Corporation Real-time document collection search engine with phrase indexing
US5987446A (en) * 1996-11-12 1999-11-16 U.S. West, Inc. Searching large collections of text using multiple search engines concurrently
US6078914A (en) * 1996-12-09 2000-06-20 Open Text Corporation Natural language meta-search system and method
AUPO525497A0 (en) * 1997-02-21 1997-03-20 Mills, Dudley John Network-based classified information systems
US5897637A (en) * 1997-03-07 1999-04-27 Apple Computer, Inc. System and method for rapidly identifying the existence and location of an item in a file
JP3666005B2 (ja) 1998-03-03 2005-06-29 マツダ株式会社 特許情報検索システム、特許情報検索装置、情報検索中継装置並びに特許情報検索方法
US6275820B1 (en) * 1998-07-16 2001-08-14 Perot Systems Corporation System and method for integrating search results from heterogeneous information resources
US6167370A (en) 1998-09-09 2000-12-26 Invention Machine Corporation Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
GB0021513D0 (en) * 2000-09-01 2000-10-18 E2 One Uk Ltd Method and system for dynamic web-page generation and computer-readable storage medium storing a program for performing the method

Also Published As

Publication number Publication date
WO2001090934A1 (fr) 2001-11-29
DE60037681D1 (de) 2008-02-14
US7043482B1 (en) 2006-05-09
EP1290578B1 (de) 2008-01-02
AU2000252256A1 (en) 2001-12-03
EP1290578A1 (de) 2003-03-12

Similar Documents

Publication Publication Date Title
DE69622350T2 (de) Ein Geschichtsanzeigegerät
DE69126795T2 (de) Dateienverwaltungssystem mit graphischer benutzerschnittstelle zum aufstellen von fragen
DE60129652T2 (de) Bildwiederauffindungssystem und Methode mit semantischer und eigenschaftenbasierter Relevanzrückmeldung
DE69527926T2 (de) Ein mit Rechner durchgeführtes Verfahren und System zur Informationswiederauffindung
DE69424586T2 (de) Verfahren und System zum formulieren interaktiver Abfragen
EP1311989B1 (de) Verfahren zur automatischen recherche
DE69531599T2 (de) Verfahren und Gerät zum Auffinden und Beschaffen personalisierter Informationen
DE69602364T2 (de) Rechnersystem um semantische objektmodelle von existierenden relationellen datenbanksystemen herzustellen
DE68927743T2 (de) Sortier-/Mischausgabe
DE69418474T2 (de) Semantisches objektmodellierungssystem und verfahren um relationelle datenbankschemata herzustellen
DE60029863T2 (de) System um einer Gruppe von Benutzern Informationen über Dokumentenänderungen zu übermitteln
DE69811066T2 (de) Datenzusammenfassungsgerät.
DE69813652T2 (de) System und Verfahren zum hierarchischen Zusammenstellen und Einordnen eines Satzes von Objekten in einem Abfragekontext
DE3650417T2 (de) Informationsaufzeichnungs- und Wiederauffindungssystem.
DE69526168T2 (de) Verfahren und Gerät zur Klassifikation von Dokumentinformationen
DE69805437T2 (de) Informationsmanagementsystem
DE102005051429A1 (de) Verfahren und Software zur Analyse von Forschungsveröffentlichungen
DE10231161A1 (de) Domain-spezifisches wissensbasiertes Metasuchsystem und Verfahren zum Verwenden desselben
DE10120869A1 (de) Verwendung eines Index für den Zugriff auf eine mehrdimensionale Subjektdatenbank
DE10348337A1 (de) Inhaltsverwaltungsportal und Verfahren zum Kommunizieren von Informationen
DE10120870A1 (de) Navigieren in einem Index für den Zugriff auf eine mehrdimensionale Subjektdatenbank
DE60037681T2 (de) Verfahren zum automatischen und gesicherten suchen von daten mit hilfe eines datenübertragungsnetzwerks
DE60300984T2 (de) Methode und Computersystem für die Optimierung eines Boolschen Ausdrucks für Anfragebearbeitung
DE60030735T2 (de) Voraussage der realisierbarkeit eines verbindungsweges
DE10215495A1 (de) Computersystem und Verfahren für die Recherche, statistische Auswertung und Analyse von Dokumenten

Legal Events

Date Code Title Description
8364 No opposition during term of opposition