
Architecture du système (note technique)
WebSTATISTICA Server et les questions de sécutité
(document PDF en anglais)
![]() |
|
|
||||||||||||||||||||||||||||||
|
|
|
|
|
![]()
|
|
|
Présentation Générale
Introduction (pour les Novices). WebSTATISTICA Server est une application intégrant STATISTICA avec Internet et permettant en particulier d'exécuter STATISTICA de façon interactive depuis un simple navigateur Web. Il permet aux utilisateurs d'accéder rapidement et facilement aux bases de données et aux puissants outils analytiques depuis tout ordinateur connecté à Internet, n'importe où dans le monde. Le produit est proposé avec une sélection d'interfaces-utilisateur basées sur le navigateur Internet (avec des boîtes de dialogue intuitives et une navigation extrêmement simplifiée) permettant aux utilisateurs de spécifier leurs analyses et d'accéder aux
résultats respectifs depuis un simple navigateur Internet. En outre, le programme met à votre disposition un certain nombre d'outils destinés à personnaliser ou définir de nouvelles interfaces-utilisateur ou de nouvelles fonctions. Vous pouvez, par exemple, faire apparaître dans votre navigateur une simple boîte de dialogue
agrémentée de trois boutons uniquement, chacun exécutant sur une série d'analyses venant compléter un rapport détaillé. Les applications de WebSTATISTICA Server ajoutent une nouvelle dimension et une infinité de
possibilités et d'applications à l'ensemble des produits d'analyse de données, de data mining, et de contrôle qualité/six sigma de la gamme STATISTICA.
Introduction (Approche Technique). WebSTATISTICA Server est un système entreprise entièrement personnalisable, permettant l'accès à des bases de données ainsi que l'analyse des données au travers du web. Construit sur la technologie du traitement distribué, il est totalement compatible avec l'architecture Client/Serveur multi-tiers. WebSTATISTICA Server expose les fonctionnalités analytiques, graphiques, de requête et de reporting de STATISTICA au travers d'interfaces Web standard, interactives, et simples à utiliser. Le programme se présente sous la forme d'une application complète, "clé-en-mains", avec une interface-utilisateur basée sur le navigateur Internet, permettant aux utilisateurs distants de créer leurs propres fichiers de données, d'effectuer leurs propres analyses et d'accéder aux résultats de façon interactive. Toutefois, en raison de son architecture ouverte, WebSTATISTICA Server comprend également des outils de développement (totalement conformes aux conventions standard de syntaxe utilisées dans le milieu industriel comme le langage Visual Basic, C++, HTML, XML), qui permettent aux départements informatiques de personnaliser les principales composantes du système, ou d'étendre le système en utilisant ses fondations en ajoutant, par exemple, de nouvelles composantes et/ou fonctionnalités analytiques très spécifiques ou relatives aux bases de données. Le système est compatible avec la plupart des plates-formes de serveurs Web (par exemple, UNIX Apache, Microsoft IIS), et fonctionne aussi bien dans les environnements Microsoft .net que Sun/Java ; aucune modification du firewall (pare-feu) en place ni des paramètres de sécurité Internet/Intranet n'est nécessaire.
Le système WebSTATISTICA Server se présente sous la forme d'une solution complète offrant toutes les fonctionnalités analytiques du produit ou de la combinaison de produits STATISTICA respective, depuis STATISTICA Base jusqu'aux produits Entreprise les plus évolués comme STATISTICA Entreprise/QC , STATISTICA Entreprise ou Data Miner. Dans sa configuration de base, l'installation de WebSTATISTICA Server offre toutes les fonctionnalités du produit STATISTICA Base et permet un accès simultané par 5 utilisateurs (au minimum) à la fois. Vous avez la possibilité d'acquérir une version spécifique de WebSTATISTICA Server avec les fonctionnalités analytiques qui vous intéressent (par exemple, STATISTICA Base pour 10 utilisateurs), ou ajouter la fonctionnalité Web Server (décrite dans cette section) à tout ou partie des postes de votre installation STATISTICA (par exemple, vous pouvez ajouter la fonctionnalité Web Server à 20 de vos 50 licences STATISTICA Entreprise).
Rendre STATISTICA accessible, “Partout et par Tous” L'un des avantages les plus évidents de la technologie de WebSTATISTICA Server est qu'elle permet d'accéder à toute la puissance des différents produits de la gamme STATISTICA depuis tout type d'ordinateur, dès lors qu'il est connecté à Internet. Les applications WebSTATISTICA Server vont donc ajouter une nouvelle dimension et une infinité de possibilités et d'applications à l'ensemble des produits d'analyse de données, de data mining, et de contrôle qualité/six sigma de la gamme STATISTICA. Par exemple, les données et rapports les plus récents (avec mise à jour des requêtes sur des segments spécifiques de l'entrepôt de données [data warehouse] de l'entreprise), peuvent désormais être rendus accessibles, en fonction des droits d'accès des utilisateurs (quelle que soit la station de travail à partir de laquelle ils se connectent) et permettent d'explorer les résultats de façon interactive (par drill down),. Dès lors qu'il est possible d'accéder à Internet (en théorie partout dans le monde), vous pouvez utiliser les outils d'analyse, de requête et de reporting du système d'analyse de données le plus complet du marché. Un Système Collaboratif Puissant d'Intelligence à l'échelle de l'Entreprise Un autre avantage, tout aussi important, de la fonctionnalité WebSTATISTICA Server est la possibilité d'utiliser le programme comme une extension des systèmes entreprise de STATISTICA (STATISTICA Entreprise/QC, STATISTICA Entreprise, ou Data Miner). Plus précisément, WebSTATISTICA Server peut constituer le cœur d'un système en réseau dans l'entreprise et permettre aux utilisateurs de travailler en collaboration, de partager rapidement leurs résultats (rapports), et les scripts de leurs analyses ou leurs requêtes. Les droits d'accès des utilisateurs ou groupes (voir le paragraphe Note Technique ci-dessous) peuvent être utilisés par les administrateurs pour définir les accès de chacun aux différentes données et/ou rapports. Dans la mesure où ces outils sont accessibles par Internet, WebSTATISTICA Server devient ainsi le système idéal pour faciliter le travail collaboratif entre des utilisateurs travaillant sur des sites ou dans des unités distinctes d'une entreprise (ou sur des continents différents), ou pour des utilisateurs amenés à travailler sur des projets communs ou se trouvant fréquemment en déplacement. Les Avantages du Traitement Distribué et de l'Architecture Client/Server Multi-Tiers En outre, que les stations de travail soient physiquement proches du serveur WebSTATISTICA Server (par exemple, dans le même immeuble) ou qu'elles en soient plus éloignées (par exemple, sur un autre continent), elles vont toutes non seulement bénéficier d'outils pour le travail collaboratif, mais aussi d'options permettant de déléguer les tâches lourdes au serveur. Plus précisément, dans la mesure où les CPU multiprocesseurs les plus puissantes (et/ou plusieurs ordinateurs) sont généralement utilisées comme serveurs, les utilisateurs ont la possibilité de déléguer les tâches lourdes au serveur, et par exemple, exécuter en "arrière-plan" sur les serveurs distants, des requêtes portant sur des Téraoctets de données et réaliser de longues séquences d'analyses et de rapports, tout en conservant les ressources de leurs stations de travail libres pour d'autres tâches. Grâce à son architecture en traitement distribué, WebSTATISTICA Server peut évoluer de manière efficace et tirer parti des CPUs multiprocesseurs et/ou d'ordinateurs multiples d'un serveur, et permettre aux utilisateurs de bénéficier de l'architecture trois-tiers dans laquelle :
Dans la version bureautique de STATISTICA , tous les calculs sont réalisés en local sur le poste client, et les ressources d'autres ordinateurs ne sont utilisées que si vous établissez l'Interface Directe avec les Bases de Données (IDBD). L'IDBD est une technologie qui va lire les données de façon asynchrone, directement depuis les les serveurs distants de bases de données (en utilisant la technologie du traitement distribué si elle est rendue possible par le serveur), sans avoir "importer" préalablement les données, ni créer une copie du fichier de données en local. Les enregistrements de données sont récupérés et envoyés à l'ordinateur STATISTICA de façon asynchrone par la CPU du serveur de base de données, tandis que STATISTICA va simultanément les traiter en utilisant la CPU de l'ordinateur local. Si vous utilisez une version Client-Serveur de STATISTICA, l'ordinateur local ne pilote que l'interface-utilisateur de STATISTICA, et tous les calculs sont réalisés sur le serveur. L'architecture Client-Serveur offre des avantage évidents lorsque vous gérez des projets importants (par exemple, qui nécessitent de nombreux calculs ou qui impliquent le traitement de grosses volumétries), dans la mesure où vous pouvez déléguer les tâches lourdes aux serveurs, et ainsi libérer vos ressources en local pour d'autres tâches. Le Client STATISTICA. Même si aucune composante du système STATISTICA n'est requise sur la partie cliente (seul un navigateur Internet est nécessaire), l'installation d'une copie de STATISTICA peut présenter certains avantages et vous offrir de nouvelles possibilités. D'aucuns pourront se demander : “Pourquoi utiliser WebSTATISTICA Server s'il faut également installer une copie du programme STATISTICA en local ?” En fait, si le programme STATISTICA est installé sur la partie cliente, vous pouvez tirer parti de l'architecture Client-Serveur multi-tiers (voir ci-dessus) et travailler de façon interactive avec STATISTICA en local, tout en déléguant les tâches lourdes aux serveurs et/ou en partageant les données et résultats avec chacun des trois autres tiers. Par exemple, grâce à un petit bouton situé (selon votre configuration) à côté des documents de sortie (tableaux, graphiques) envoyés dans votre navigateur par WebSTATISTICA Server, vous pourrez rapatrier l'objet (tableau ou graphique STATISTICA) en local dans son format natif STATISTICA (au format .STA ou .STG), ce qui vous permet de poursuivre son analyse ou sa personnalisation "off-line" à l'aide des outils STATISTICA installés en local.Les Avantages de la Technologie Multithreading La plate-forme WebSTATISTICA intègre la technologie du traitement distribué et du multithreading, ce qui permet une gestion optimale de charges importantes de calculs. Cette technologie permet un traitement rapide, même pour des projets nécessitant de nombreux calculs sur de grosses volumétries, en exploitant de façon optimale les différentes ressources (CPU) du serveur, ou de différents serveurs travaillant en parallèle. L'illustration ci-dessous représente un projet en cours d'exécution par un serveur équipé de quatre processeurs. L'onglet Performances, du Gestionnaire des Tâches de Windows, démontre l'utilisation maximale des ressources des quatre CPU qui traitent en mode multithreading, un même projet STATISTICA Data Miner nécessitant de nombreux calculs.
En outre, l'architecture de WebSTATISTICA permet de s'affranchir totalement des contraintes de plates-formes ; WebSTATISTICA offre une interface-utilisateur entièrement basée sur votre navigateur Web et permet à des groupes d'utilisateurs de collaborer sur projets communs et de les gérer au travers du Web, que ces utilisateurs soient situés “à l'autre bout du couloir ou à l'autre bout du monde”. Totalement évolutif (La technologie du traitement parallèle). L'une des spécificités de la technologie du traitement distribué de STATISTICA est qu'elle permet non seulement d'exploiter de façon optimale toutes les CPU du serveur (pour un gestion efficace, à la fois de tâches/utilisateurs multiples et de projets individuels, lourds en calculs), mais qu'elle peut également utiliser les ressources de plusieurs ordinateurs du serveur. Cette fonctionnalité unique est importante dans la mesure où elle permet d'augmenter les performances de façon significative. STATISTICA est en mesure d'utiliser la technologie du traitement parallèle sur différentes unités physiquement indépendantes (comme certains super-ordinateurs). Par conséquent, lorsque vous disposez par exemple de trois serveurs, équipés de 4 processeurs chacun, STATISTICA sera en mesure d'exécuter (et répartir les calculs) un même projet individuel sur les 12 processeurs (si l'ampleur du projet nécessite ce type de traitement). L'Interface-Utilisateur de WebSTATISTICAL'utilisation de STATISTICA dans une configuration WebSTATISTICA permet aux différents utilisateurs d'exécuter le programme de façon interactive depuis un poste client, au travers d'un simple navigateur internet, dans une interface proche de celle qui vous est familière dans la version bureautique. Par conséquent, vous pouvez exécuter la partie client de l'application (la partie frontale ou “front end”) depuis tout ordinateur (même un ordinateur portable), dès lors que cet ordinateur est connecté à Internet. En revanche, les calculs et autres opérations réalisés sur les données s'effectuent toujours sur le serveur (distant) qui possède généralement des processeurs plus puissants et des ressources de stockage plus importantes (ces ressources étant gérées par l'architecture optimisée du système, en traitement distribué et en multithreading, pour une efficacité maximale). Les différents aspects de l'interface-utilisateur de STATISTICA peuvent être exécutés par un ou plusieurs utilisateurs simultanément, depuis tout ordinateur au monde (dès lors qu'il est connecté à Internet, même avec une connexion à faible débit), et le serveur se charge de tous les calculs et de toutes les opérations à réaliser sur les données, en fonction des droits d'accès et règles de sécurité applicables aux différents projets et groupes d'utilisateurs, tels qu'ils sont spécifiés par l'administrateur du réseau. WebSTATISTICA vous permet de réaliser toutes vos opérations d'analyse de données, de data mining, de contrôle qualité, de gestion de bases de données, de requêtes ou de personnalisation des graphiques, de façon interactive dans une interface-utilisateur simplifiée.
Après ouverture d'une session WebSTATISTICA,
l'utilisateur a la possibilité de sélectionner une source de données (un fichier de données ou une connexion à une base de données),
puis a la possibilité de visualiser les données et de les modifier si besoin grâce à un éditeur interactif de feuilles de données ;
il sélectionne ensuite les analyses qu'il souhaite réaliser au travers d'un système traditionnel de menus (ou par des raccourcis du menu personnalisé “Mon Menu”),
puis sélectionne les variables et spécifie éventuellement d'autres paramètres pour l'analyse ;
Diverses fonctionnalités permettant d'effectuer des opérations spécialisées de contrôle qualité, de data mining ou autres opérations sur des bases de données sont accessibles de façon interactive au travers d'un simple navigateur.
Toutefois, à côté de ces interfaces simplifiées proposée par défaut, WebSTATISTICA met également à votre disposition un ensemble d'outils permettant de personnaliser l'interface-utilisateur et développer vos propres applications, intégrant des fonctionnalités prédéfinies spécifiques, et se présentant sous une forme répondant précisément à vos besoins et à vos exigences. ![]()
Parmi la longue liste des spécificités de WebSTATISTICA Server, citons également une compatibilité remarquable avec les principales normes et conventions du marché. Vous pouvez déployer WebSTATISTICA Server sur les plate-formes les plus courantes de serveur Web (par exemple, Apache basé sur UNIX ou IIS) ; vous n'avez donc pas à vous préoccuper particulièrement des protocoles locaux de sécurité (firewalls) en vigueur dans votre entreprise. Mais si vous le souhaitez, vous pouvez aussi installer le système du serveur Web peut également être installé dans le cadre du déploiement de WebSTATISTICA Server (nous préconisons un système IIS). WebSTATISTICA Server utilise une technologie propriétaire développée par StatSoft garantissant les excellentes performances du programme et son évolutivité (par exemple, pour tirer parti de plusieurs serveurs STATISTICA, multiprocesseurs, travaillant dans un environnement de traitement distribué). Cette technologie est le fruit des nombreuses années d'expérience de StatSoft qui ont permis d'offrir aux plus grandes entreprise du monde entier, des systèmes entreprise performants et évolutifs. Toutefois, WebSTATISTICA Server continue à utiliser les protocoles standard de communication du marché (par exemple, XML) garantissant (a) l'indépendance vis à vis de la plate-forme, (b) l'évolutivité en douceur vers les technologies futures, et (c) une facilité de personnalisation pour le client. Cette possibilité de personnalisation est d'ailleurs accrue par le fait que seules les conventions universelles de syntaxe (notamment des scripts Visual Basic, C++, HTML, XML) sont utilisées pour personnaliser, configurer et définir toutes les opérations analytiques spécifiques et tous les résultats dans WebSTATISTICA.
Bien que l'architecture dans une configuration standard utilise deux “machines”, un serveur Web (par exemple, un serveur Apache basé sur UNIX) et au moins un serveur STATISTICA (avec possibilité d'utiliser plusieurs Serveurs STATISTICA) : L'architecture permet la mise en place d'un Serveur Web générique en utilisant un langage de programmation standard sur le serveur Web. Le rôle du serveur Web est de "packager" (préparer) les demandes des utilisateurs (qui sont reçues au travers du navigateur), et de les transmettre au Serveur STATISTICA, puis de traiter les réponses envoyées par le Serveur STATISTICA afin de les restituer (réacheminer) à l'utilisateur final (au travers de son navigateur Web). La communication entre le Serveur Web et le Serveur STATISTICA s'effectue par l'intermédiaire d'une technologie basée sur les conventions universelles XML. Le système est entièrement personnalisable et offre aux utilisateurs souhaitant développer leurs propres modifications ou extensions à un système (clé-en-mains et prêt à déployer), un ensemble d'outils destinés à modifier tous les aspects des scripts exécutés par STATISTICA (sur la partie du Serveur STATISTICA) ou de l'interface-utilisateur exposée aux utilisateurs sur la partie client léger (basée sur le navigateur). Seuls les outils les plus universels et les plus connus (notamment Visual Basic ou XML/HTML) sont utilisés pour personnaliser ou étendre le système. La définition des pages Web et les scripts STATISTICA à exécuter sont stockés dans un répertoire spécifique du Serveur STATISTICA et sont gérés selon le principe de la "file d'attente". Le système contient également un utilitaire (Gestionnaire du Traitement Distribué) permettant de gérer la charge entrante de demandes de traitement et leur répartition de façon optimale entre les différents threads de STATISTICA et les différents ordinateurs du Serveur STATISTICA. Le système logiciel WebSTATISTICA Server inclut également les extensions Web du langage STATISTICA Visual Basic. Ces extensions du langage SVB permettent au développeur d'un script de laisser le système gérer l'affichage des graphiques et tableaux de résultats dans les pages Web produites de façon automatique, ou de personnaliser l'aspect des pages de résultats produites en ajoutant des instructions HTML s'il le souhaite. Les questions d'authentification et de sécurité constituent des questions fondamentales dans l'architecture de WebSTATISTICA Server. Lorsqu'il démarre une session, l'utilisateur doit “se connecter” au système en renseignant son nom d'utilisateur et son mot de passe. Les administrateurs du système peuvent contrôler l'accès aux sources de données et aux scripts en accordant des droits d'accès individuels (par utilisateur) ou collectifs (par groupe d'utilisateurs). Le niveau de sécurité le plus élevé permet aux utilisateurs avancés (ou aux administrateurs) d'exécuter quasiment tout type de script (par exemple, pour administrer le système ou effectuer des opérations de maintenance). Ce niveau nécessite un droit d'accès particulier (le plus élevé), dans la mesure où -en raison de la nature et de la puissance du langage STATISTICA Visual Basic- il donne accès (pour les utilisateurs autorisés) à toutes les ressources du réseau. Remarque : ce système peut être intégré avec les réseaux concurrents “traditionnels” de STATISTICA (c'est-à-dire ceux qui ne sont pas basés sur le Web) ou avec les systèmes Entreprise de STATISTICA, ce qui vous permet d'installer, par exemple, une licence en réseau concurrent ou un système Entreprise de STATISTICA composé (au total) de 50 licences, dont 20 seulement seront accessibles par l'intermédiaire de WebSTATISTICA Server.
Le tout premier avantage des applications WebSTATISTICA Server commence bien évidemment par la liste impressionnante des spécificités fonctionnelles de STATISTICA. En outre, et contrairement aux produits concurrents, nous offrons une solution complète avec une interface-utilisateur basée sur le Web et non pas simplement un kit de développement (même si des outils de développement sont également proposés pour étendre ou personnaliser le système, voir ci-dessus). De même, il n'est pas nécessaire qu'un serveur Web spécifique soit préalablement installé (compatible ou non avec les normes de sécurité et autres impératifs du client). Enfin, notre système est piloté par les scripts Visual Basic, C++, HTML et XML standard que les utilisateurs ou les administrateurs du système peuvent aisément modifier. En outre, la technologie du traitement distribué et du multithreading offre un système d'une performance et d'une rapidité jamais égalée à ce jour.
L'application complémentaire WebSTATISTICA Knowledge Portal permet aux utilisateurs de distribuer et partager de façon efficace et sécurisée, des ensembles organisés de résultats au travers du Web. Vous pouvez définir des groupes de travail (avec des droits d'accès distincts, et donc permettre un accès différencié aux différentes parties de la base de données des résultats), avec une arborescente intuitive des différents éléments disponibles, et des options permettant la diffusion de documents actualisés sur le serveur Web en temps réel.
©Copyright StatSoft 1984-2009. |