Le co-occorrenze rappresentano le parole contenute in una frase, in un paragrafo, in un documento o in un insieme di documenti. Sono combinazioni di termini che, senza le parole comuni e le stop word, permettono di capire di quale argomento si sta parlando. Tale processo di comprensione è simile a quello del search engine semantico che, però, non ha ancora la capacità di leggere ed interpretare il significato delle parole leggendo le stesse in sequenza. Però può comprenderlo in maniera approssimativa facendo una analisi delle associazioni di parole.

Per esempio, si è appena parlato con termini altamente specifici quali search engine, semantica e SEO: in questo caso, tali parole rappresentano le co-occorrenze di questo documento. Le altre parole che, invece, sono quelle di uso comune, per esempio verbi o articoli, e possono tranquillamente essere trascurate rappresentano le stop word. Per capire il tema o l'argomento, il search engine, mette a confronto le co-occorrenze specifiche contenute nel testo con le combinazioni di parole nei diversi campi della propria base di conoscenza. Nel momento in cui questa comparazione risulta esatta o anche molto simile, allora, l'algoritmo associa il testo al campo semantico, ovvero l’argomento. Ritornando al caso di questo documento, l’argomento o il campo semantico con le parole specifiche simili risulta essere quello che riguarda la seo semantica.

La comprensione associativa non avviene senza co-occorrenze

Le co-occorrenze, quindi, si trovano alla base della comprensione associativa. Il significato di ogni parola, infatti, non viene interpretato dall’algoritmo ma, esso, si limita a intuite l'argomento generale mediante l’analisi delle relazioni fra le parole di un documento e le confronta con quelle del database di riferimento, la base di conoscenza. Per questo motivo, l'algoritmo che analizza le co-occorrenze non viene classificato fra gli algoritmi più avanzati di intelligenza artificiale né di lettura semantica automatica del testo. Anzi, è solo una semplicissima euristica della linguistica, praticamente meccanica, per capire velocemente l'argomento del testo, privo dell’approfondimento vero e proprio del significato dei testi. Infatti ai termini della frase non viene attribuito alcun particolare significato ma il testo viene diviso semplicemente in gruppi di parole che ne valutano il significato complessivo o, meglio, l'argomento di cui tratta.

In sostanza, diciamo che l’analisi delle co-occorrenze permette di trovare le parole e le frasi più rilevanti attorno ad un significato.

La ricerca semantica: cos’è e come funziona

Invece, la ricerca semantica, detta anche semantic search, rappresenta un altro metodo per trovare le informazioni in un database. Essa, non utilizza però solo le parole chiave ma analizza anche la semantica per approfondire il significato delle parole.

Quindi, nel momento in cui un utente digita la query dà al search engine delle parole chiave in combinazione; il motore di ricerca va ad analizzare il campo semantico di ogni parola tentando di individuare anche tutte le altre parole che sono pertinenti con quei termini. In questo modo, il motore di ricerca comprende la differenza di due parole simili fra loro ed acquisisce anche i sinonimi. Tale processo prende il nome di espansione del campo semantico.

In questo processo, il motore di ricerca usa una base di conoscenza, cioè un database in cui si trovano tutte le parole e le relazioni delle parole ed anche le entità, cioè i concetti. Quindi, il search engine capisce quando due query hanno gli stessi concetti pur essendo diverse e va a sostituire le query iniziali anche con le query espanse andando così a selezionare tutte quelle risorse che restituiscono una coincidenza col campo semantico espanso della prima query.

Abbiamo dunque capito che scrivere "come realizzare" o "come fare" ci metterà davanti agli stessi risultati o, comunque a pagine di risultati molto simili fra loro. In certi casi potremmo avere persino delle risorse che non hanno al loro interno le keyword usate nella query, bensì altri termini più pertinenti.

La selezione delle ricerche diventa così molto ampia ed è più facile trovare risultati di qualità ed evitare gli spam.

Attenzione allo spam!

SPAM e phishing sono presenti in quantità sempre più insistenti durante una normale navigazione e tutto ormai sembra incentrato sulla grande corsa per il ricatto. La polizia postale ne è ben al corrente, ormai in circolazione c’è una mole non indifferente di messaggi di posta elettronica con l’obiettivo di estorsione: gli utenti ricevono una mail che comunica loro che il proprio account di posta elettronica è stato hackerato mentre venivano visitati siti per adulti. Il messaggio contiene una vera minaccia, quella di divulgazione con il conseguente versamento in criptovaluta. Per scovare gli impostori, una delle prime attività da compiere è quella di verificare attentamente il mittente dell’email, estorcendone i dettagli del messaggio ricevuto e quale sia il reale indirizzo da cui proviene e se può più o meno considerarsi affidabile. Purtroppo il controllo non risulta infallibile, perché hacker e cattive persone facilmente riescono a mascherare il proprio indirizzo mediante l’ “email spoofing”, cioè una pratica che consente di impostare un indirizzo ufficiale come nome del mittente.

L’inganno è in agguato. Di particolar eimportanza è che voi non scarichiate degli allegati di mail di cui non siete strettamente sicuri, anche per file semplici come un .pdf o .doc, i quali possono spesso essere ponti di malware o di altri file eseguibili, capaci di installare virus o backdoor sui vostri dispositivi. Guardate con attenzione anche gli URL, ovvero l’effettivo indirizzo del sito visualizzato nella stringa del browser, che nella maggior parte dei casi invitano l’utente a rilasciare dati e informazioni strettamente personali, i famosi “dati sensibili”il link malevolo potrebbe essere somigliare ad uno veritiero, ma potrebbe anche presentare un’estensione di dominio anormale, qualche lettera di troppo nel nome, una connessione visualizzata come “non sicura” dal browser e in “http” invece che nel protocollo “https” (quello con il lucchetto).

Di grande importanza è che alcune organizzazioni, come le banche, non ci scrivono via e-mail per chiederci di aggiornare qualsivoglia dato, loro hanno già quello che serve. Anche i sociale sono fonte di inganno e spesso, oltre che tramite mail, il phishing passa anche dai social network, con la mera violazione degli account che diventano a loro volte delle strade per infettare tutto. Ricorda: mai cliccare o rilanciare catene o link dubbi che arrivino nella messaggistica o in cui si venga taggati. La sicurezza informatica è di estrema importanza, cerca di usare sempre correttamente la navigazione su internet non intaccando in qualche scoglio che potrebbe costarti l’identità.

Pin It

Potrebbe interessarti anche...

Cronologia chat facebook: come cancellare e recuperare le conversazioni

cronologia chat facebook

Vediamo come prepararci a cancellare le conversazioni nel caso in cui decidessimo di attivare una nuova mail con dominio "facebook.com". Gli utenti di Facebook, il social network più famoso del mondo, aumentano di giorno in giorno. Facebook è infatti una piattaforma sociale molto utilizzata dal popolo del web perché consente di creare dei collegamenti massicci tra persone, non solo da un punto di vista personale ma anche sul versante prettamente lavorativo.

Leggi tutto...

Redirect 301 con file .htaccess: così non perdi page rank nella SERP!

Ci sono molti motivi per cui, nel corso di vita di un sito, ci si può imbattere nella necessità si modificare la URL, l’indirizzo di una o più pagine del sito, magari per renderle più parlanti e rispondenti ai contenuti del proprio sito (es: da www.mionome.it/indexpagina1 a www.mionome.it/homepage) o addirittura si può cambiare il dominio stesso (da .it a .com, per esempio).

Leggi tutto...

Guida linguaggio HTML: qui c'è davvero tutto

guida html

La promozione e la valorizzazione di un'attività, di un prodotto o di un determinato servizio, passa sempre più spesso attraverso l'utilizzo degli strumenti informatici. Le Web Agency sono proprio delle agenzie che si occupano di realizzare portali web, al fine di dare visibilità ai clienti che richiedono i loro servizi. La creazione di un sito web necessita infatti della conoscenza accurata di internet e del computer; ecco perché spesso è importante affidarsi a professionisti del settore per la realizzazione dello stesso. Il World Wide Web è incentrato soprattutto sull'uso, sulla comprensione e la padronanza dettagliata del linguaggio html; i siti web sono infatti una summa di pagine ipertestuali che sfruttano proprio tale linguaggio per esistere e fornire informazioni.

Leggi tutto...

Avviso sul Copyright

I contenuti di questo sito web sono protetti da Copyright. Ti invitiamo gentilmente a non duplicarli e a scriverci a info [@] elamedia.it se hai intenzione di usufruire dei servizi erogati dalla nostra Redazione.

Protected by Copyscape

Contatti

Sede: Via Luigi Gadola 3, 00155 Roma
Email: .
Per conoscerci meglio scarica la nostra Brochure.  

Scrivici

  

L’interessato autorizza al trattamento dei propri dati personali (Informativa Privacy ex art. 13 Reg. (UE) 2016/679; clicca qui per sapere come gestiamo Privacy e Cookie) per le seguenti finalità:

       Via Luigi Gadola 3
00155 Roma

Email: .

Partita IVA: 12238581008 

Per conoscerci meglio scarica la nostra Brochure


In alternativa puoi utilizzare il form che trovi 
in Home per comunicare con la nostra Web Agency 

GDPR e Cookie Privacy. Questo sito utilizza solo Cookies tecnici (necessari al suo corretto funzionamento). La prosecuzione della navigazione o l’accesso a qualunque sezione del sito senza avere prima modificato le impostazioni relative ai Cookies verrà interpretata come accettazione implicita alla ricezione di Cookies dal sito stesso.