Inicio > .Net, C#, Computación, Programación, Visual studio 2010 > Encontrar palabras duplicadas continuas .net

Encontrar palabras duplicadas continuas .net


Aveces pasa en los texto que quedan palabras repetidas como ” texto es es” pocas veces esto tiene un significado así que podemos encontrarlas y si gustamos eliminarlas.

Acá les dejo el código para encontrar dichas palabras:


/// <summary>
/// find number words repet in text
/// </summary>
/// <param name="strWord">word to find</param>
/// <param name="bolUpperLowerCase"></param>
/// <returns>Match property width find or null if not find</returns>
public List<Match> FindWordRepetContinue(string strWord, bool bolIgnoreUppercaseLowercase)
{
// Define a regular expression for repeated words.
Regex rx = new Regex(@"\b(?<word>\w+)\s+(\k<word>)\b",
RegexOptions.Compiled | RegexOptions.IgnoreCase);


List<Match> lstmatch = new List<Match>();


// Find matches.
MatchCollection matches = rx.Matches(TextOriginal);


foreach (Match item in matches)
{
if (bolIgnoreUppercaseLowercase)
{
string strTempValue = item.Value.ToLower();
if (strTempValue.ToLower().Contains(strWord.ToLower()))
lstmatch.Add(item);
}
else
{
if (item.Value.ToLower().Contains(strWord.ToLower()))
lstmatch.Add(item);
}


}


return lstmatch;

}

recuerden que pueden encontrar la librería completa en  https://github.com/Mteheran/TextManager

  1. Aún no hay comentarios.
  1. No trackbacks yet.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: